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第 一 章 和 矩阵 理论 


在 本 章 中 我 们 将 介绍 “多 元 统计 分 析 " 课 程 中 所 需要 炬 阵 的 有 
关 理 论 ， 凡 是 在 衣 常 线性 代数 教材 中 已 有 的 材料 我 们 将 不 加 证 明 
或 者 路 加 说 明 地 进行 引用 、 员 然 本 章 的 内 容 并 非 本 教材 的 中 心 内 
容 ， 但 其 有 关 的 结论 对 于 以 后 各 章 的 学 习 都 是 十 分 重要 的 。 在 
本 章 中 我 们 引进 了 在 通常 线性 代数 教材 中 很 少 提 及 的 一 些 和 矩阵 运 
算 ， 如 抄 长 向 量 vecA4 将 帮助 我 们 把 随机 和 矩阵 的 讨论 化 为 热 知 的 
睛 机 商量 的 讨论 。 而 Kronecker 乘积 4@B 在 处 理 随机 矩阵 的 
协 方差 矩阵 时 有 着 十 分 简明 的 意义 ， 不 同 的 Jacobian 行列 式 的 
导出 对 于 求 出 各 种 随机 矩阵 相应 的 分 布 密度 是 至 关 重 要 的 ， 项 刻 
读者 能 热 练 掌握 . 


$ 1.1 矩阵 的 有 关 定 义 及 其 运算 


(一 ) 矩阵 概念 及 其 运算 

令 R 是 由 实数 组 成 的 域 ， 在 中 任 一 组 数字 的 四 则 运算 总 能 
进行 ， 设 au,，……,ape 是 中 pg 个 元 素 ， 称 由 这 些 元 素 组 成 的 
P 行列 矩形 方块 


#l rz fle 
da 2 zg 
Ds Fp" “dpe 


为 一 个 p X 9 阶 和 矩阵 ,通常 记 为 大 写字 母 A 一 (aj)pxe， 其 中 aii 
是 4 的 第 1 行 第 ij 询 上 的 元 素 。 如 果 4 的 诸 元 素 都 为 0, 则 称 4 
是 一 个 p Xx zg 阶 零 矩阵 ,证 为 O,~:， 在 不 致 误解 时 可 简 记 为 0. 
如 果 户 一 9， 称 4 为 请 阶 方 阵 。 当 PP 一 1 时 也 称 有 4 为 4 维 行 向 
量 , 当 9 一 1 时 也 称 有 4 为 上 2 维 列 高 量 , 


以 后 总 是 用 
9 
4 
囊 示 由 元 素 el … say 组 成 的 列 向 量 ,而 用 of 一 (eye 
家 未 由 元 素 a1,4;,-…-,a。 组 成 的 行 向 量 . 

如 果 上 阶 方 阵 中 所 有 非 对 角 线 上 元 素 爹 为 0 (到 op 一 4,1 关 
门 ， 则 称 4 为 了 阶 对 角 阵 ， 对 角 线 元 察 为 4,,…, 1， 的 对 角 阵 记 
为 4 或 者 diag(44,……, 4s)。 特 别 当 4 全 为 1 时 ,相应 的 对 骨 阵 
称 为 宇 阶 单位 方 阵 , 可 简 记 为 了， 

称 在 主 对 角 钱 下 方 诺 元 素 全 为 0 的 方 阵 为 上 三 角 知 阵 ， 称 在 
主 对 角 线 上 方 诸 元 赛 全 为 0 的 三 阵 为 下 三 角 抵 阵 ， 

称 将 后 阵 4 的 诸 行 《 列 ) 换 成 想 应 的 诸 列 〔 行 》 所 得 到 的 新 
和 矩阵 为 4 的 转 量 矩阵 , 记 为 4，。 从 而 车 4 一 (aoxy， 则 4 一 
{asenps 

如 果 方 阵 4 满足 4 一 4 个 ， 称 4 为 对 称 和 矩阵 (或 对 称 阵 )。 

有 了 时 我 们 把 一 个 p x 9 阶 和 矩阵 4 表示 成 分 块 形式 


4 
2 人 3 
N\A ds 
其 中 Ai; 是 4 的 一 个 pg; X g; 阶 子 第 阵 (i=1, 吉 ,j 一 1 


外 且 之 所 一 外 之 一 人 


下 面 介 绍 乍 阵 的 运算 ， 
两 矩阵 4,8 《只 有 相同 的 列 数 和 行 数 ) 的 和 规定 为 
A Boa) Cb Cant By) 
一 实数 1 与 矩阵 4 的 乘积 规定 为 
i*A= A N= (Cg) 


《Bassrs 则 规定 4 与 有 的 积 为 


时 


人 


册 4 也 基 一 个 训 Xr 阶 怎 阵 , 它 的 第 《5 大》 元 素 是 之 ojéite 

可 以 验证 上 述 运 算 具 有 以 下 性 质 : 

1) A+ B=B++ A, 

2) {4+B)+ C=A+(B+ co), 

3) 4 十 CC—1)4A 一口， 

4) (Ci a)A=iA+ A, 

5 A 二 B14 18, 

6) UA (tp)A. 

7) (At BIC= AC BO, 

8B) CABYC 号 ACBC), 

9 I A A 4, 

车 妇 和 B 为 问 阶 上 C 下 ) 三 角 奸 阵 ， 那 么 它 科 的 和 4 十 B 以 
及 它 信 的 积 4 8 也 基 同 类 开 的 上 (和 下) 三角 知 降 。 

转车 矩阵 具有 下 烈性 质 : 

1) (A ~ A 

2) (A+ BYmA+ BB, 

3) (A BY B.A., 

若 盾 阵 有 4 种 5 共有 相同 的 行 数 与 列 数 且 按 同 样 方式 分 据 ， 即 
4 一 (Ai)，B 一 (B81)， 那 么 

A+ B= (C4 B;), 

车 mxX # 阶 矩阵 4,n x 阶 托 阵 记分 别 划 分 为 A Ai), 

号 一 《Bi 其 中 4ii 为 m; X si 阶 姬 阵 ，Bji 为 #n; X p; 阶 抄 


阵 , 且 Pj mm DI, Sp. 那么 


AB 一 (> AnBin) 


《二 ) 矩阵 的 坦 积 

如 果 A4 是 m Xn 有 阶 和 矩阵 , 下 是 请 9 阶 矩 降 ， 它们 的 直 积 
《或 者 称 大 roneceker 积 ) 址 如 下 定义 的 mp X n9 阶 邱 阵 

A®B 一 (ojB) 

其 中 4 一 《oi)。 它 表示 以 oiB 为 它 的 第 (1, 力 块 的 分 块 逢 阵 . 
喜 积 运算 具有 以 下 钼 质 : 

1) 0@4 一 4@0 一 0. 

2) (4+ A DP = 4HBP + 4WB. 

3) AB(B,+ BI) = ABB, 十 ABD,, 

4) cAIB 一 af * ADE. 

5) AADBLB, 一 (CAD BN AD BE), 

6) (ABBY — A4@F'. 

证 明 ”我 们 仅 证 明 5) 式 ,其 余 请 读者 自行 完成 

衣 A 一 (Cai)pxms 出 一 (ejk mas B, 是 有 X7 阶 答 阵 ，8B， 
是 Xx w 阶 和 矩阵 ， 于 是 


A dWBB, 一 (2 cc BB ~ (2。 scn BiBs) 
fm ps ji 


是 一 个 ps x nw 阶 条 降 ， 它 的 第 (i) 据 是 了 1 eeiB1B82. 而 
i=l 
8 = CanB), B,C 一 CoirB2) 
按 分 块 卸 阵 弛 法 有 
(CAB A AD BI) 一 (> enciB1B,) 
‘j=1 


从 而 57) 式 成 立 。 
令 vecA 表示 把 PX9? 阶 矩 阵 的 诸 行 向 量 依 次 排列 成 一 个 拉 


长 的 行 向 量 再 员 以 转生 而 得 到 的 pq 维 询 向 量 ,出 


4 
本 信 硬 


vec 吧 一 《auyans ”9 村 1g ss 2 gs pr" sapey 
通过 这 种 记号 可 以 把 有 半生 阵 的 运算 化 为 癌 量 的 运算。 这 
时 ,对 于 插 阵 方程 


AXB = CC (C1.1) 
其 中 4,X,8,C 分 别 为 mXw 阶 ,# Xr 阶 ,， +r X4q 阶 ,mxXg 
阶 纯 阵 , 利 用 直 积 记号 可 以 收 号 成 男 一 等 价 形式 ; 

(CADB' YecR — vect 《1.2》 
对 此 只 须 注 意 到 把 (1.1) 利 (1,2) 具 体 写成 线性 方程 组 后 都 是 


> DY) rib Ca [ee 


由 此 可 得 
定理 Ll yecCAXB) 一 CABH vecr, 
例如 ,对 于 向 量 x 和 了 有 
vectx* ¥) CO— XBy, 

《三 ) 向 量 的 相关 和 Sehmidt 正 交 化 方法 

为 了 对 矩阵 有 更 深刻 的 理解 , 下面 我 们 复习 一 些 向 量 空间 ( 线 
性 空间 ) 的 知识 。 

设 Rr 表示 实数 域 R 上 的 全 部 了 维 向 量 , 那么 尾 一 了 维 向 量 
可 以 表示 为 R? 空间 上 的 一 个 点 , 它 作 为 特殊 窜 阵 ,可 以 在 R? 上 
定义 如 法 和 数 乘 运算 ， 显 然 R* 关于 这 些 运算 是 封闭 的 , 我 们 称 
R? 是 一 个 向 量 空间 . 

对 于 p x 了 阶 和 矩阵 4 二 《og), 我 们 记 它 的 列 向 量 为 el -， 
ar， 行 向 量 为 ab， ao， 那么 4 可 以 写成 

好 一 《at Gy 或 者 4 一 (ab ep 了 《1.37) 
认 而 矩阵 4 茎 可 看 成 R? 空间 中 的 8 个 点 ,又 可 看 成 R? 空间 中 
和 的 了 个 点 ， 另 外 由 于 短 阵 及 与 vecA 是 一 一 对 应 的 ， 它 又 可 看 成 
是 Rf 空间 由 的 一 个 点 。 
对 于 一 组 向量 o，:…:，al， 妇 果 存 在 不 全 为 0 的 一 组 实数 
加 


cl ez， 使 每 
co 十 ce + ea 

成 立 , 则 我 们 称 向 量 组 @i,'… ,a 是 线性 相关 的 。 否 则 称 向 量 组 
qa: -0 是 线性 无 关 的 ， 

容易 证 朋 下 列 性 岳 : 

1) 任何 包含 事 问 量 的 向 量 组 总 是 线性 相关 的 ， 

2) 设 ea，a 是 非 零 向 量 ， 则 它们 是 线性 相关 的 充分 必 
要 条 和 件 是 : 一 定 存在 茶 一 i 使 得 


a 一 HD eiiai. 
Tomi 


成 立 , 其 中 ci 不 多 为 06 《i 下 19 1 疡 门 ， 即 存在 +， 使 得 
ei 是 其 他 向 量 Gi i 的 线性 组 合 。 

着 癌 量 a 和 4 满足 gab 一 0， 则 我 们 称 4 与 5 正 交 . 

3) 若非 零 疝 量 4 ,9， 殉 两 正 交 , 则 它们 必 线 性 无 关 . 事 


实 上 , 若 存 在 不 全 为 0 的 实数 c; 使 得 > ) ciai 一 0， 出 由 


纤 1 4 
(Bom) (Toe) da 

推出 c, 全 为 0, 得 出 矛盾 。 
记 lall 一 Vara， 它 表示 向 量 a 的 长 度 , 称 长 度 为 1 的 向 量 


为 单位 向 量 . 
给 出 ER* 中 一 组 向 量 om,'…,as， 考 虚 由 这 些 向 量 的 所 有 可 


3 
能 的 线性 组 合 ba C9 组 成 的 集合 


位 cia，o…，c。 是 实数 


它 显 热 对 于 向 量 轴 法 和 数 绕 适 算是 封闭 的 ， 从 而 构成 R? 中 的 一 
6 


个 线性 子 空间 、 称 为 百 向 量 mm，'…，q 张 成 的 子 空 间 .。 记 为 
巡 (Ca 对 于 pp 区 4 阶 上 矩阵 4， 按 (1.3), 以 后 将 使 用 记 


号 


LAD Ha A EA HA) py) 

记 乡 是 R?* 的 一 个 线性 子 空间 ,如 果 存 在 一 组 线性 无 关 的 
回 量 za 使 得 双 一 Ca 于 0); 则 称 sa， 是 
线性 子 空间 多 的 一 组 基底 ,3 称 为 红 的 维 数 , 这 时 多 中 的 
尾 一 向 量 都 可 以 通过 它 的 基底 向 基 的 线性 组 侣 来 表示 。 如果 这 组 
基底 还 满足 

ama— 0 Ci. qa! ij= ,9) 
则 {fe ea 又 称 为 好 的 枉 准 正 交 基 底 。 

例如 司空 间 中 ,向 量 《1,0:07 .0107，(《0.0,17 构成 了 
RI 的 标准 正 交 基 底 。 

如 果 (as) 中 ,a 线性 无 美 ， 我 们 可 以 如 
下 移 造 一 组 新 的 标准 正 交 基底 。 

仿 


ba ba hb Ch 一 ab bb) 
那么 显然 有 刀 一 0， 依 次 再 令 
bi 一 al — habs — hrsbes 
Ch 人 
那么 世 } 是 两 两 正 交 向 量 且 和 仅仅 是 前 下 个 向 量 sr， 
的 线性 组 侣 。 再 令 
Al 
于 是 ce 构成 了 Ca, :+:，as)》 的 一 组 标准 正 交 基底 . 
这 种 方法 有 时 也 称 为 Sehmidt 正 交 化 方法 . 
此 了 时 如 果 记 4 一 Cm，-……， aus), CC 一 《cr *, cy )， 下 
Schmidt 正 交 北方 法 知道 存 丰 抱 阵 刀 使 得 
C 一 4 .4) 
其 中 避 是 对 和 角 元 素 均 大 于 0 的 上 三 角 生 阵 。 


" 7 


(四) 下 阵 的 次 和 闭 矩 奈 

对 于 给 定 的 bp x 9 阶 和 矩阵 4 一 (aa 称 Sa， 
ay) 的 维 数 汐 4 的 秩 , 记 敌 rk(C4D)。 从 线性 代数 知识 忌 知 它 有 下 
列 性 质 : 

1) rk(A) = rkl 4A). 

2) rkCABY < min(rk( AY ,rkC BYY. 

3) rk(A) 一 0 等 价 于 4 一 0, 

4) 如 时.4 是 非 零 的 p XX 9 阶 乍 阵 , 则 1 才 rkC A4) < mintp， 
q), 

5Y max(rkC A), rk {BY rkCAIBY SE min (Cp, rkCAY 十 
rkCB)). 

4 


6Y rk ( 0 
设 4 是 靖 阶 方 阵 , 定 祥 它 的 行列 式 为 


. 产 
1 一 > Ct? TY sy 
大 pl 


其 中 2 表示 对 数组 n 一 《m，***。as》 的 所 有 排列 的 加 法 ,而 


0 
) kA) + rk BY, 


NCn) 表示 排列 & 的 族 序 数 .即将 (mt,… ,rp》 变 换 成 (1,2,，…， 
PP) 需要 的 对 换 次 数 。 例 如 a 一 《3,4,1,2)， 那 么 N(a) 一 4， 通 
常 方 阵 4 的 行 询 式 记 作 1A1 或 者 det4。 | 
行列 式 具 有 下 列 性 质 ; 
1 人 7| 一 工 


p . 
2) {41| = 1 di 其 中 A diag (av 
3) |4| — 141, . 
a 
4) 14| 一 ]] ei。 其 中 4 是 # 阶 上 C 下 ) 己 角 和 矩阵 ，s;; 是 4 


”有 。 


的 对 锡 元 素 . 

5) leA| 一 ce?14A1。 其 中 < 是 常数 , 4 是 ? 阶 方 阵 . 

6) 将 方 阵 的 任 二 行 ( 列 ) 予 以 交换 ,行列 式 改 变 符号 

7) 抬 吾 阵 的 第 了 行 ( 列 ) 泪 以 一 个 常数 如 到 第 ; 行 ( 列 ) 上 去 。 
那么 行列 式 的 值 不 变 ， 于 是 当 行 列 式 中 基 行 ( 列 ) 是 其 介 诸 行 ( 列 ) 
的 线性 组 侣 时 ,行列 式 的 值 为 4。 

8) 4,B8 是 河 阶 方 阵 ,出 148| 一 | 41，181. 


但 
9) |(4 -4 ，181、 其 中 448 沟 为 方 了, 


10) 14@B1 一 14。 181?, 其 中 4 是 ? 阶 方 阵 ，B 是 # 阶 
方 阵 ， 
证 明 ”这 里 公证 明 10) 式 


gnub “> dgB 
4es-|: | 
GnB --. apsB 


Ga Gpls 召 0 
_[ : | s 
op 


B . 0 | 
Wn 
0 | 
所 以 10) 式 成 立 ， 国 


令 侣 ) 表示 从 方 阵 4 中 路 去 第 i 行 和 第 i 列 后 得 到 的 子 抵 
阵 , 称 | 4P| 为 oj 的 余子 式 , 而 称 ACi, 门 一 《一 17Ti|AP| 为 
3 的 代数 余子 式 ， 

利用 行列 式 狂 质 5) 可 以 得 到 


gules 一 Qlply 
， 一 141*， 


了 


人 人 si Glop 
ACi,j)=| 0 1 0.… :0 


人 ET itisp 
本 有 


ie 
肥 4 全 门 是 把 4 中 第 站 行 疏 汶 gi 一 1， 其 余 qi 一 0 让 二 
下 一 1 ,Pp) 语 得 到 的 新 方 阵 的 行列 式 . 于 是 有 下 列 二 式 成 立 : 
p. [A k= i, 
BD AR -1 
i=1 0 A 
p [A| r= i, 
名 Ajs en ei 
落 记 C 一 《CACiy 门 )， 上 述 结 论 则 可 表示 为 
定理 12 Cd 一 dc 一 4 了 
对 于 方 阵 4， 如 果 存 在 方 阵 8B 使 得 4*B 一 B* #4 一 1, 则 
称 8 是 4 的 族 阵 , 记 为 B 一 4 +， 世 它 是 唯一 的 . 
如 时 方 阵 4 的 行列 式 1A| 志 9， 则 称 4 是非 窗 异 方 阵 。 显 然 
如 果 4 有 逆 阵 存在 , 则 141 所 0 了。 反之 车 4 是 非 奇异 的 ， 由 定 再 
12 知 道 B 一 |A4l"'*，C” 正 是 4 的 逆 阵 。， 若 记 A 一 《a3),， 则 
Wy. . 
af 一 [和 人 
北 托 阵 具 有 下 列 性 质 : 
设 4,8 是 了 辽 非 奇异 方 阵 , 则 
1D) (AD = 4, 
2 (CA) (4). 
3) (A BY Be A 
4a) [A = 1 


- Dn 


5) 14| 关 0< 儿 则 月 道 提 阵 < 所 >kCd) 一 所 

设 A4,B 为 非 奇异 方 阵 , 则 

0 CADBE)'— A BB 

7) 上 下) 三角 失 阵 的 道 阵 仍 为 上 (下 ) 三 角 矩 阵 , 

从 性 质 5) 知道 非 再 异 方 阵 4 的 秩 等 于 它 的 行 ( 列 ) 数 ,故我 们 
也 称 4 为 满 秩 窍 阵 . 

定理 1.3 1) 站 了 是非 奇 异 方 阵 时 ，rk(4) 一 rkCA)。 

2) 令 BB 是 秩 为 了 的 p X gq 阶 峙 降 , 则 rkCAB) 一 rk( A)。 

证 朋 1 记 CC 一 AB， 由 于 8 非 膏 异 , 所 以 4 二 C838" 由 
秩 的 性 质 2) 知道 


rE) 二 TEA SrkCe), 

于 是 rkKCAB) 一 rk(CA), 

3) 由 rk(B8) 一 了 2， 知道 9 全 pp， 不 妨 设 8B 一 (B118,) 其 
中 B, 基 p Xp 阶 短 阵 且 rkCB,) 一 pp， 于 是 由 1) 得 到 

IkKCA). — 1kCABI) SE rk AB) SE rk dA) 

从 而 EAB8) 一 rkCL4)7 蜂 

推论 1.1 设 PP.@ 非 坷 蜡 ，PL4@ 二 P80, 则 4 一 8， 

定理 1.4 rktAdAd) — rk(A), 

证 明 如 果 4 为 p Xa&a 阶 和 矩阵 生 4 的 秩 为 pg， 则 由 定 更 
13 知 rk(AA) 一 rkE(Ad ) 一 (A)。 一 般 情况 , 由 Ax 一 0 一 
dx x A Ax 0 AxX—0, 信 而 估 (A) 一 引 (A A), 于 是 
IkCAAN—Irk(A), 重 

设 4 基 了 阶 方 阵 ,其 对 角 线 元 素 的 和 称 为 4 的 训 , 记 为 

tr(A) 一 3 Ga 

关于 迹 的 运算 有 下 列 性质 : 

1) trfad 十 有 五 一 tr 十 有 cr 吾 ， 其 中 op 是 常数 。 4 、 吾 
是 同 阶 方 阵 ， 

27 设 A4 是 p x 9 阶 年 阵 ,B 是 9 Xp 阶 和 矩阵 ,出 


tCABY) = tr(B A) = 3 3 aijbie 


t=1 jwl 
3) tr(ABBY = trAd * trB, 
4) 设 4,B 剖 是 p x gq 阶 算 阵 ,出 


» 
tAB—= vcAdvecB 一 | DY) obye 


i=1 j=l 

《五 拭 阵 的 分 解 

首先 我 们 介绍 初等 阵 和 人 算 阵 的 韧 等 变换 的 定义 . 

初等 阵 Pij, DORD),TiCX) 分 别 如 下 规定 : 

Pi 是 在 单位 阵 了 中 改 g6 一 昕 一 0 a; 一 qj; 一 1 后 得 到 . 

Dx》 是 在 单 空 阵 了 中 疏 or 一 下 后 得 到 ， 

TY 是 在 单位 阵 了 中 改 os 一 下 后 得 到 。 

和 拖 阵 的 初等 变换 是 指 对 和 气 阵 施行 下 列 变 换 : 

1) 对 调 逢 阵 两 行 ( 列 ) 的 位 局 ， 

2) 以 不 等 干 曙 的 常数 衣 征 以 矩阵 茶 一 行 ( 列 》.。 

3) 以 非 零 常数 大 葬 以 某 行 ( 列 ) 后 加 刘 曙 一 行 《 列 ) 的 对 应 元 
素 上 去 ， 
容易 看 出 ,上 述 变换 正 相 当 于 分 别 用 初等 阵 Py,Di(D ,Ta(R) 分 
别 左 < 右 ) 乘 该 矩阵 ， 

出 于 初等 阵 是 满 秩 的 , 且 它 们 的 邀 阵 是 机 应 的 初等 阵 ,而 初等 
阵 的 乘积 仍 是 湛 秩 阵 。 于 是 有 

定理 15 1) 设 4 是 关 X9 阶 矩阵 ，rk(4) 一 "， 则 存在 
pp Xp 济 潢 秋 窍 阵 P 和 4 X34 访 满 秩 年 阵 吕 使 得 

Ai. 0 
4 一 P(n ») 9 (1.5) 

2) 设 4 是 p Xag 阶 奸 隆 。 rkCA) 一 *， 则 存在 秩 为 了 的 抵 

阵 F 和 6， 其 中 F 是 p Xr 阶 ， 6G 是 + x4 阶 ,使 得 
A—~F.G 
证 明 ” 1》 只 须 对 4 施行 初等 变换 即 可 得 证 ， 
s 于 


2) 在 (1.5) 式 中 令 P 一 (8 ,Pi)， 其 中 卫 是 2 X+ 阶 知 阵 ， 
P, 是 p x (yp 一 +) 阶 和 矩阵 。 以 及 令 0-(0). 其 中 CG 是 :x 


4 阶 矩 阵 ,9; 是 《9 一 r) Xx 9g 阶 第 隆 , 显然 rkKCF) 二 IECG) 一 
+r， 了 由 可 得 
4 一 PC 和 
对 于 卢 阶 方 阵 UU， 如 果 它 满 是 D0 一 UU 一, ， 则 称 
了 是? 阶 正 交 矩阵 。 这 时 车 记 0 二 (pp)， 则 有 oa 一 
6j。 这 里 
1 了 一 上 
人 
即 {th 是 邑 (5) 的 标准 正 交 基底 ， 
正 交 和 阵 和 具 有 下 列 性 质 : 
设 U,V 起 避 阶 正 交 阵 ， 
1) Ur: — 了。 
2) IU| = +1, 
3) UL* UU7!1 UU, 仍 为 正 交 阵 . 
定理 1.6 设 4 是 疡 阶 满 铁 矩阵 , 则 它 可 唯 - 表示 为 40 * 
了 ， 其 中 孔 为 过 阶 正 交 阵 , T 是 对 和 角 元 素 上 > 的 上 三 角 和 矩阵 。 
证 明 由 于 有 4 满 秩 ，A 的 诸 列 向 量 和 由 (1.42 式 知道 
通过 Schmidt 正 交 化 肖 潜 可 把 怒 表示 为 : 
一 可 了 了 
成 立 , 其 中 U 为 了 阶 正 交 阵 , TT 为 上 三 角 甜 阵 且 诸 ii > 了, 设 4 一 
“了 一 DT 有 不 同 的 上 述 表 示 从 而 
UU Ter TH 
即 TTT! 婚 是 上 三 角 阵 又 是 正 交 阵 ， 于 是 TJTT! 一 《见习 题 
1.13)，。 即 了 ,一 了, 因此 Vw UU,， 上 述 4 的 表示 式 是 唯一 的 罩 
上 述 表 示 法 也 常 称 为 4 的 正 交 三 角 分 解 ， 
定理 1.7 设 4 为 P 阶 满 秩 阵 , 且 庄 i 阶 主子 行列 式 均 不 为 0 


四 了 了 


必 一 1 yb， 则 存在 上 三 角 秆 阵 五 和 下 三 角 挎 阵 宇 ， 它 们 都 
是 了 阶 满 秩 阵 , 使 得 

证 明 ”利用 归纳 法 ， 当 p 一 1 时 显然 成 立 ， 设 一 1 时 定理 
成 立 。 记 


Au Vv 
4-(% ») 
其 中 4 是 户 一 1 阶 满 秩 阵 ( 册 于 | Al 二 0), f,v 是 fp 一 1 维 
向 量 , 。@ 为 实数 。 由 归纳 法 4 一 TB (其 中 有 为 ?一 1 维 
上 三 前 矩阵 ，z 为 加 一 工 维 上 三角 第 阵 ) 立即 可 得 4 一 了 也. 
其 中 


TT, 0 U, TI 
T - (po | "一 (0 的 _ pum) 
仍 分 别 为 下 三 角 和 矩阵 和 上 三 角 和 矩阵 且 沉 夸 。 定 理 得 证 。 首 
定理 45 和 定理 1.7 得 到 的 滤 涟 因子 分 解 表 示 萃 是 十 分 有 用 
的 。 


§1.2 非 奇异 矩阵 的 分 块 道 矩阵 及 其 一 般 
矩阵 的 广义 道 矩阵 


本 节 将 给 出 非 奇 异 柴 阵 的 分 块 矩阵 的 道 矩 阵 及 其 一 般 抢 中 的 
广义 道 算 阵 的 表达 形式 。 
“一 ) 非 奇 异 矩 阵 的 分 块 矩阵 求 道 
- 设 4 是 绢 阶 满 秩 算 阵 ， 它 的 逆 第 阵 为 全 ， 它 科 可 表示 为 下 
列 分 块 矩 陈 : 
Ay A A A 
4 一 (Ce 4) 4 (mn 1 
其 中 4 4 和 均 为 rn Xr 阶 和 矩阵 ，4o 和 A 均 为 Xi 阶 算 
孟 ，r 十 了 一 户 ， 
车 4 满 秩 , 记 A 一 A 一 44 


。 了 4 。 


若 4 满 碑 , i 一 一 
定理 2 和 1 如 果 4 和 4 非 冀 腊 , 则 


(5, 人 ( + ATiA A A A A 《2 19 
A A —AriAudi < 
如 果 如 和 4,， 非 寄 异 , 风 

(4 人 4) ( Li 一 如 da ) (2.2) 
A A —AriAnAr} Azi+ Arl A Ardi dAji 


证 明 ” 仪 证 C2.1) 式 ,(2.2) 式 可 类 似 证 明 . 
由 于 Ani 存在 ,容易 验证 下 式 成 立 : 


了 " ) (4 人) (! A) 
— AudAit 1 /A A 0 I 


(天 0 
0 A 一 4 Ala) 


由 于 |4| 一 144， 4 s 关 0， 知 144 送 0， 于 是 4 存 
在 ,上 式 两 边 求 道 并 作 适 当 变 换 得 到 : 


和 各 1 一 4iidoy AL 0 I 0 
(es 人 本 0 I ) ( 0 4 (a 1) 
展开 后 即 得 C2.1) 式 。 目 : 
如 有 果 ,A 都 非 奇 异 , 则 有 
4 一 4 十 A AnArAAn 《2.37 
Azl = A A AuadriiAdrdii. C2.4) 
另外 还 有 
A A AP = A 
A = — AriAdrAdn = AriAdvArl 
和 和 一 一 4 一 一 AL 
关于 非 奇 异 矩 阵 的 行列 式 则 有 
推论 21 如 果 Au,Aw 非 奇异 , 册 
ld = [Al — [Al | 4st, 
推论 22 设 A 是 p x& 和 阶 矩 阵 。 互 是 9 Xp 阶 算 阵 ,4 
: "13 


0 ,那么 


127 一 ABI =— 4+" |41 — BA (2.5) 
证 明 利用 推论 2.1 可知 
1, 
WW ?上 本 一 到 4 一 六 1|21, -BA 
BI 


一 ia7 — AB| = 1a!, — AB|. 
中 小 


推论 2.3 设 4 有 是 户 X9 阶 短 阵 ，B 是 4 Xp 阶 抵 降 , 那 么 
i+ 4 一] 七 了 
证 明 ”内 须 在 推论 2.2 中 令 1 一 1,4 用 一 4 代替 即 可 ， 量 
关于 涉及 结 阵 的 和 的 求 递 下 列 定理 是 十 分 有 用 的 ， 
定理 2.2? 设 P 非 奇异 0 一 PP 十 VV 和 了 FPC 也 非 
奇异, 册 
8 一 K《P 十 1 三 一 下 -一 Pw 十 了 Pi syV»Pp-! 
C2.6) 
、 P ~—U | 、 
证 明 令 4 一 (|。 ，)， 利用 前 面 的 记号 ,只 须 将 
A P+ UV, Aa= I VP As— VU, A VV 
代入 《2.3) 式 即 可 得 证 ， | 
例如 ， 若 x 和 y 分 别 为 P 维 网 量 ,，P 是 了 维 方 阵 洲 足 定理 
2.2, 则 有 
{PixAry) = Pi—(l+yP Xx)!* Px* yp 
| . . 《2.73 


二》 一般 振 阵 的 广义 逆 矩 阵 

众所周知 , 道 皇 阵 在 解 线 竹 方程 组 时 十 分 有 用 , 当 4 是 靖 阶 非 
奇异 算 隆 ， 线 性 方程 组 Ax 一 > 有 唯一 解 且 可 求 忆 绑 为 x 
41y， 这 里 4 是 4 的 遂 阵 ， 

然而 当 4 是 奇异 矩阵 《如 14| 一 0》 或 者 当 4 不 是 方 阵 时 却 
没有 上 述 良 好 结果 ， 但 我 们 仍然 希望 求 得 与 47! 类 似 的 措 阵 ,使 
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得 当 4x 一 入 容 时 ， 它 的 辉 可 以 由 x 一 GY 表 出 ， 这 生生 
阵 G 称 为 4 的 广 涉 道 ， 记 汐 4 ,显然 这 时 只 一 性 等 性 硕 将 安 并 
失 。 本 书 对 于 广 忌 遂 仅 要 求 掌 据 它 的 概念 和 理解 它 的 一 些 家 示 方 
法 。 

定义 2.1 设 4 为 p X49 阶 矩 降 ，4 的 广义 北 4 是 一 个 
4 Xp 阶 皂 降 ， 它 使 得 对 任 一 使 方程 Ax 一 了 相 容 的 向 量 y， 
x 一 A4Y 是 Ax 一 y 的 解 ， 

定理 2.3 4 存 在 的 充分 必要 条 件 基 A4- 有 一 4 成立 

证 明 设 z 是 任意 ?了 维 向 量 , 当 y 一 Az 时 ，Ax 一 yy 相 
容 , 从 而 4 在 在 保证 了 对 尾音 向量 z 有 

ACA AF AA yy As 

于 是 44 A 一 4, 

反之 ,车 4x 一 ? 相 容 ， 意味 着 满足 -4 一 的 向 量 存 
在 ,由 于 44 4 一 4， 所 以 有 

AACAWY = Aw 

即 A4C477) 一 ,这 说 有 明 A473 是 Ax 一 y 的 解 。 目 

定义 2.2 对本 何 矩 阵 4,A” 总 存在 。 且 若 rd 一 rr 且 
性 可 表示 为 


4=P(" 0)0 《其 中 P ,9 为 满 秩 卸 阵 》 


则 4 人” 的 一 般 形式 是 


人 一 on(” “) P-: (2.8) 


其 中 CC ,D,E 是 任意 的 相应 的 子 粘 降 . 
证 明 天 用 44 4 一 4 知道 - 


(or( yj)o-e( 0)0 


韦 推论 11 有 


* 7 


代 人 上 式 , 得 到 8B 一 1, C0 ,D,E 任意 从 而 (2.8 式 蕊 立 ， 重 

出 4” 的 一 般 表 这 式 C2.8), 我 们 可 以 得 到 下 列 结论 : 

1) 4 的 广 尽 闭 一 般 有 无 穷 多 个 ,而 4 唯一 的 充分 必要 条 件 
是 4 存在 ,日 全 一 人 

2) Frkfd) rk(A), 

结论 2) 可 由 rk(A) 守 rk(4AA A) 一 rk(A) 得 到 。 

下 面 介绍 广义 道 与 需 等 抵 阵 之 间 的 联系 。 

如 果 算 阵 4 满 足 A ~ 4 那么 称 4 为 村 等 矩阵 (或 等 等 阵 )。 

3) 44- 和 4 4 是 具 签 短 隆 ,rk(AA 于 于 (A) 一 
rk(CA). 

证 明 由 A444 一 A 立即 可 知 A447 和 全 44 是 得 等 盾 
阵 ， 竺 论 的 第 二 部 分 可 由 

rkCAY = tkCAA TAY SAA) ES rk) 

得 到 ， 时 

定理 25 1) (4'A) A 是 4 的 广义 逆 ，A'(A4A) 也 是 4 
的 广义 逆 。 

2 ACA A A A A, AACAAI A= A. 

3) PP 一 444 4 和 0 一 ACAA4) 4 是 舌 等 对 称 和 矩阵 ， 
且 rkCP) 一 IE 一 rk(A4)， 且 它们 是 唯一 的 . 

证 上 明 ” 羔 似 于 定理 1.4 知道 条 阵 方 程 

AKC 0 “AX = = 
所 以 有 
A ANA A 

因此 
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AACAAYT AA A drACA A AA= A 
从 而 1),2) 的 第 一 式 得 证 。 类 似 可 证 第 二 式 。 

由 广义 道 竹 质 知 P 一 ACA A) 4 是 需 等 阵 ， 且 引 C(P) 一 
kA 记 P; 一 ACA ATAC 1.2), 其 中 《AAN 和 (CAAT 
是 44 的 任意 二 个 不 同 的 广 尽 邀 , 那 委 

Pi ACA A A = [ACA A A ATCA AN A 
= ACAANLAACA A A TACA AN A 
一 了， 
即 ACA A)-A 关于 44 的 任 一 广义 道 是 唯一 的 。 

将 等 式 4A'A(A'A4) A'4 一 44 转 置 后 知道 [Cd 也 一 

是 .44 的 广 立 道 所 以 
P'— [ACAAY A ~ ALCAAN TA = P. 
即 ?是 对 称 袁 等 阵 ， 关 于 吕 可 娄 似 证 明 ， 是 

关于 奇异 方 阵 的 广义 逆 矩 阵 的 分 块 表 示 形 式 与 非 毅 异 时 求 得 
的 表达 式 类 似 , 只 是 多 出 一 些 任意 项 ， 读 者 感 兴 超 可 参考 [9]， 

由 于 广义 递 的 形式 下 唯一， 给 运用 带 来 了 一 些 不 便 ， 我 们 着 
望 从 众多 的 广义 道中 找 册 一 个 具有 “良好 ”性质 的 特殊 广义 逆 。 我 
们 称 满足 下 列 性 策 的 广义 道 为 4 : 

1) 44+4 =— 4. 2) ArAAT = A+, 

3) CAA'Y = AAT, 4) CATAY = A+A, 

称 4+ 为 4 的 加 号 赣 , 又 称 4 的 Moore-Penrose 省, 

对 于 任 一 个 秩 为 + 的  X 4 阶 和 矩阵 4， 按 定理 1.5 知道 存 
在 秩 为 + 的 p Xr 阶 年 阵 BR 和 > xg 阶 第 阵 C, 使 得 4 一 FG 
成 立 。 这 时 天 PP 及 GG 的 道 阵 存 在 ,那么 

一 GGGY UF FYF’ 
就 是 满足 上 述 条 件 的 唯一 的 41+。 

8B, 满足 4+ 的 四 条 性 质 是 容易 证 了 明 的 (见习 题 1.4), 下面 我 
位 证 明 它 是 唯一 的 ， 设 C5 也 满足 上 述 四 条 性 质 , 则 有 
BAd— BA*CA— AB AC EABAY* CE AC TCA 


同 埋 可 证 4B。 一 46G。 于 是 
Bm BAB = CAB CAC=C, 
即 41+ 是 唯一 和 的 ， 年 
下 看 给 出 A+ 的 一 些 基本 性 质 , 请 读者 自行 验证 ， 
DD (CA) mA, (AN+ — (A+Y. 
2) A = CAAA = ACAAN, 
3》 若 4 是 对 称 壬 等 阵 即 4: 一 A, 4 一 4, 则 At 一 4 
4) 4 是 满 秩 方 阵 , 则 A+ 一 4 
5) 设 Pi,P; 是 正 交 阵 , 则 (PAP+ 一 PiA+P'. 
6) 设 4 二 diagl4 Xp) 则 A+ 一 diag(47 ,让 ,其 


中 
+ fa hi 
好 一 人 1 一 0。 
例 ” 求 第 阵 
1 0 1 
< 1 | 
0 1 1 
的 加 号 逆 4+。 | 
解 ” 按 定理 15 4A 一望 .G 其 中 
1 0 
1 0 1 
"-( 中 c-({_， I 0) 
1 1 
下 是 ; 1 1 /2 1 
,os 1 一 tl 
Crp ) 4CC) 了 (1 , ) 
所 以 


人 一 OCGGIHF'FIE' 


1 -1 0 

一 上 | 1 1 
3 

1: 0 1 
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注 ”在 上 酌 中 由 于 A4 的 秩 为 2， 它 的 第 一 , 二 往 线 社 充 关 , 故 
可 直接 取 它 为 上 述 G, 而 可 出 4 一 FG 直接 求 得 。 一般 地 
G 可 利用 定理 1.5 求 出 ， 


§ 1.3 ”若干 特殊 矩阵 及 其 性 质 


本 节 中 我 们 将 讨论 对 称 阵 , 圭 等 阵 ,对 称 宪 等 阵 { 投 影 阵 ) 以 及 
正定 矩阵 的 有 闫 性 质 并 给 出 二 次 型 极 值 的 一 些 性 质 ， 

《一 ) 对 称 罕 等 陆 及 其 性 质 ， 

商 先 我 们 复习 一 些 有 关 特 征 根 和 特征 向 量 的 知识 ， 

设 4 是 ? 阶 方 阵 , 若 x 是 ? 维 非 零 向 量 ,满足 4x 一 必 ， 其 
中 是 一 个 实数 ， 则 4 称 为 4 的 特征 根 , 而 x 称 为 4 相应 于 4 的 
特征 向 量 . 由 于 《4 一 1i1 之 一 和 ， 所 以 4 一 1) 安放 一 上 
网 4 是 特征 方程 14 一 41,| 一 0 的 根 。 友 之 :着 14 一 好 | 一 0 
有 概 2， 册 保证 存在 非 零 向 量 x 使 得 4x 一 4x， 这 说 明 性 一 方 
阵 总 有 特征 根 和 特征 向 量 

由 线性 代数 我 们 知道 

定理 31 车 A 是 ? XX 了 阶 实 对 称 阵 , 则 

1》 4 的 特征 根 全 为 实数 。 

2) 相应 于 不 同 的 特征 根 的 4 的 特征 向 量 相互 正 交 。 

3) 存在 一 个 正 交 和 抑 阵 已 一 《eer)， 使 得 

Pd4P 一 diagtiis "sdp) 
其 中 %; 是 4 的 特征 根 (Gi 一 1,"…',p). 
由 定理 3.1 知道 4 可 写成 下 列 形式 


p 
A4— DD) tere 
E=] 


这 种 表达 式 称 为 4 的 谱 分 解 ， 

为 方便 超 见 ， 以 后 我 们 总 以 4K42 一 ch A) 表示 4 的 第 i 
大 的 特征 根 (i 一 1,-.…,p), 

定理 3.2 设 4 是 7? Xx 了 阶 矩 阵 且 rkC4d4) 一 r， 则 


.21 * 


p, 


1) 4 为 考 等 阵 的 充分 必 开 条 件 是 站 (4) 十 IE 一 A) 二 = 


2) 轿 等 阵 的 特征 根 只 能 是 0 和 1. 

3) 如 果 4 一 A， 则 trC4) 一 (41), 

4) 如 果 4 为 对 称 寡 等 阵 , 则 存在 x + 阶 和 矩阵 UU， 使 得 
A=U*U, UU= 1,, 

证 明 由 于 


人 一 站 和 作 A(T ") (© 人 
0 17 4 0 一 {, 4 0 / 


户 
人 0 0 


™ (! 一 (4 一 _ 0) 


所 以 rk 一 和) 十 一 rk(4A) 十 下 (7 一 人， 由 此 立即 推出 


i), 


如 果 / 是 考 等 阵 4 的 特征 根 , 则 存在 非 堆 向量 x*， 使 得 
x AX Ax MCARY) = Hix 


因而 如 一 4，4 非 0 即 1, 这 就 证 明了 2)。 


由 于 rE(A4) 一 r+， 由 定理 1.5 生存 在 席 秩 矩阵 已 和 ,使 得 


4-P(r "9 


申 下 一 4 以 及 推论 1.1 可 知 


所 以 


-=[(， ez(， 6 


I 0 
-u(r 一 一 全 (4)， 


于 是 3) 得 证 。 

如 果 A 是 了 阶 对 称 守 等 阵 , 宙 定 理 3.1 的 3) 知道 存在 正 交 算 
阵 了 一 (U,V), (其 中 UU 是 xr 阶 ,F 是 2 X (Cp 一 rf) 阶 ) 使 
得 


7 0 
4—P( )P' UU 
o 0 


县 UD 一 了 成立 ， 量 

定理 33 车 # x 了 阶 答 阵 A 是 对 称 罕 等 阵 且 tk(A) 一 r+， 
那么 一 定 存在 秩 汶 + 的 pf Xr 阶 和 矩阵 卫 ,， 使 得 

A POPIP) P 

证 明 由 zk(L4) 一 +, 知 存在 秩 当 的? x r 阶 矩阵 P 和 

91 使 得 4 一 PIC 由 全 一 4 推 得 
. POP 一 TB 一 人 
由 推论 1.1 知 ， 纪 Pi 一 六 成 立 ， 又 由 4 对 称 , 所 区 PIG 一 0.Pi， 
从 而 
Pi— Pi OP.™ Our PP 
由 于 PiP, 是 r 阶 满 秩 第 阵 ，(P 了 P,P 存在 ,所 以 
QO PPPDYL. 

于 是 4 一 PCPP :Pi。 是 

上 述 讨 论 的 对 称 考 等 隆 4 很 有 用 ， 它 有 许多 优良 性 质 ，。 如 它 
也 是 非 负 定 和 矩阵 ，41+ 一 和 4， 且 存在 正 交 阵 了 使 得 
” 小， r 一 IEKK4) 
等 等 ,下 面 介绍 对 称 酸 等 阵 在 几何 上 的 意义 。 

设 多 是 线性 空间 R* 上 的 一 个 线性 子 空间 , 则 一 定 存 在 男 
一 笠 空 间 多 +， 使 得 对 每 一 个 向 量 x € R*, x 可 唯一 分 解 成 x 一 
十 XN 其 中 XE 如 ，X& c++， ， 且 对 于 任意 的 xiE 和 

2。 


PAP— ( 


x 2 有 xx 一 0 我们 称 吧 1 是 巡 甘于 R" 的 下 交 垃 
空间 ,而 xl: 称 为 x 在 加 上 的 投影 。 踢 然 当 x 和 yy 是 XX)y 
在 所 上 的 投影 ,那么 ex 十 byi 正 sx 十 by 的 投影 , 即 投影 
算 子 是 一 个 齐 次 线性 算 子 。 而 在 有 限 维 空间 中 ， 投 影 可 由 一 个 短 
阵 米 实现 , 网 x, 一 Px。 共 中 了 了 皮 决 于 和 ， 称 ?为 双 上 的 投 
影 经 阵 , 人 简称 投影 阵 ， 

定理 34 类 了 省 了 是 挫 影 矩 阵 的 充分 必要 条 件 是 了 为 对 称 睡 
等 阵 。 

证 明 车 P 了 是 经 上 的 投影 矩阵 , 则 对 于 一 功 x& R* 有 

Pix= Px X=— Px 
| 
x{i— PYPx= x{P— PP)x—0 

对 一 切 x ER* 成 并 ;所 以 了 一 P'P 以 及 了 一 了 P” 城 立 ; 从 而 知 
诞 投影 隆 了 是 对 称 军 等 阵 . 

反之 ; 若 己 第 对 称 寡 等 阵 , 由 定理 33 知人 存在 Pi; 使 得 了 ~ 
PPPY iP,, 记 cf 一 (PP), 于 是 

X= Px Pee CP) 其 中 点 一 《PP Pix, 
有 Xz 一 1 一 P)x 满足 
一 

到 xzae MMP， 让 起 x 在 避 ( 了 P,) 上 的 投影 阵 了 遇 卫 是 
SP 上 的 批 影 阵 。 时 

以 局 为 方便 起 现 我 们 也 称 对 称 芭 等 阵 为 投影 阵 。 

定理 35 设 A4 是 了 了 x4 和 阶 矩 阵 ， 则 了 一 ALA'A) A 是 
(dd) 上 的 投影 阵 。 

证 明 ”由 定 惠 2.5 知 P 是 对 称 舌 等 阵 。 又 对 于 尾 一 同 是 x € 
R" 有 Px 二 AeE (CA) (其 中 者 一 (AA) Ax), 

如 同 定理 3.4 证 明 训 知已 是 涛 (4) 上 的 投影 阵 。 站 

注意 ， 对 于 周一 子 空间 区 《4) 上 的 援 影 阵 避 以 有 几 种 不 同 
的 表示 方法 ， 但 它们 实质 上 是 同一 矩阵 。 以 后 我 们 常用 Po 一 
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有 HH 


AAA) 4 表示 双 (4) 上 上 的 投影 阵 , 几 时 了 一 Pu 表示 红 区 4 
上 的 投影 阵 。 

定理 36 设 多 是 R* 中 子 空间 ， 向量 ee R*, 则 在 皇 
中 存在 向 量 5 使 得 


a—al = intlx—al 
和 EE 


证 盟 令 P 是 绢 上 的 投影 阵 ， 则 a 一 Pa 十 (1 一 Pa， 
其 中 Pa 约 , (I 一 了 ak +， 册 于 对 任 一 x€E 绑 有 x 一 
PY)a 一 0. 于 是 

(x—al(x— a)—(x— Pa)x— Pa? Tt I — Pyal 
显然 当 取 5 一 Pa 时 定理 成 立 ， 外 

定 杰 3.6 指 山 对 于 任 一 向 量 at R*， 在 到 中 以 它 的 授 影 
Pa 在 距离 意义 下 与 a 最 接近 , 它 的 几何 意义 十 分 直观 ， 

下 面 定理 指出 投影 阵 本 以 进一步 分 解 成 两 个 投影 阵 的 和 ， 它 
对 未 今后 的 讨论 是 有 用 的 ,尽管 它 的 形式 比较 复杂 ， 

定理 3.7 设 附 为 上 的 #X 产 阶 和 矩阵 下 一 【X AD， 其 由 罗 
是 ?Xr 阶 ,2 是 nx(p 一 r)》 阶 ,那么 有 

了 天) 一 XX IN 十 (XL 一 XX XX ) 
* [KE — KNACKIRY IER CR 一 XARAK) RAY 
(3.1) 


若 记 了 一 上 一 Px,)X,、 上 式 可 简 记 为 
Px 一 Px, Py (3.2) 
好 2(X》 上 的 投影 阵 可 分 解 为 名 (Xi) 和 多 (Y) 上 投影 位 
之 和 。 
证 明 ”由 于 rk(X) 一 b， 故 【XXX 存在 。 记 
Vu Vy 
Vi 中 
那么 下 一 EE Vy = 
Vs = Ri Oo KA NX IRIX 一 XT 一 Px )X, 
利用 定理 2.1 的 还 雪 知 道 


v= xx—( 


sn 加 史 重 


人 NT 
于 是 通过 运算 求 得 
Pr = (Xis XV 站) 


一 【不 | 一 KVEVAY FT 各 一 EVAVY + KV, 

而 天 一 VEVs 正 是 了 一 《1 一 Px,)X 它 满足 27Y 一 0 县 
Vs 一 了 ，Y” 因此 (3.1) 和 (3.2) 成 立 。 时 

注 痪 到 定理 3.7 中 多 人 7) 正 是 多 (CKD) 关于 芭 (5) 的 正 
交 补 空间 ， 车 了 一 2 我 们 可 以 如 下 直观 说 明 ; 此 时 (XY 表示 
由 向 县 x， 和 x; 张 成 的 子 空间 ,那么 人 鱼 一 向 量 x ER* 在 (XX) 
下 的 投影 可 以 分 解 成 两 个 投影 之 和 ,一 个 是 x* 在 xa 方向 上 的 投 
影 , 另 一 个 是 在 至 (X) 中 与 x 惟 直 方向 上 的 投影 ， 即 在 y 一 
(一 Pw)x 方向 上 的 投影 ， 因 此 Pxx 一 Px,x 十 PX， 换 句 话 
说 : Px 一 Ps 十 Py. 


CT 汶 wtO5) 在 名 (XY) 投影 
DM 为 WCO3) 在 部 (五) 投影 
ON 为 KDS) 在 品位 ) 投影 


图 3.1 


(二 ) 非 负 定 矩 阵 帮 其 性 质 

令 4 是 ? 阶 对 称 阵 ，x 是 一 个 # 维 向 量 ， 那么 x'Ax 是 x 庄 
分 量 的 二 次 齐 次 多 项 式 ,简称 为 x 的 二 次 型 . 

如 果 对 于 所 有 非 零 回 量 x 总 有 x Ax 全 0【《 宇 0 的， 那么 称 
4 是 正定 矩阵 《 非 负 定 和 矩阵 或 者 半 正 定 抵 阵 )。、 简 记 为 4 之 0 


26 。 


(4 > 0). . 
定理 38 ”如果 4 是 正定 ( 半 正 定 ? 钳 阵 时 , 4 的 所 有 特征 根 者 
为 正 ( 非 负 》, 诸 主子 伟 隆 Ai; 也是 正 完 5 半 正 定 ) 阵 。 且 .1| 以 
及 4 的 诸 主 子 行列 式 全 为 正 ( 非 负 》， 
证 明 由 了 对 称 战 定理 3.1 郑 存 在 正定 矩阵 P 使 得 
4 一 Pidiag(hy-… ,hs) "Pp 
令 了 一 PPxz 一 (yp 《其 由 一 Ca) 风 


x'dx 一 【《PX)idiag(h yy IPX= Dy > 0(20) 
iml 


对 一 切 非 零 向 量 y 成 立 ， 特 别 地 , 取 y 一 0， ……:0,1,0，- 07， 
其 中 1 在 第 i 位 置 上 , 即 得 1 之 1005 之 0 此 外 | 


1]41 = |P'diagChis | 一 I] hi > 信之 07。 


著 记 由 4 的 前 上行, 前”* 列 组 成 的 子 矩阵 为 4A， 如 果 取 yy 一 
《2 ,8 了 7 了， 其 中 研一 (zz 是 r 维 向 量 , 和 为 诸 元 素 全 为 
的 ?一 7 维 向 量 , 那 么 Mi 4us 一 yd4y 对 于 一 切 非 骞 向 量 z 恒 大 
于 以 恒 大 于 等 于 0) ,从 而 Ai 正定 ( 半 正 定 ), 且 | Axl > 0( 守 0) 
成 立 ， 对 其 他 主子 兴隆 可 类 似 证 明 ， 目 

定理 39 一 个 扰 隆 有 4 是 半 正 定 的 充分 必要 案件 十 它 可 以 表 
达成 4 一 X" 素 。 若 4 是 正定 的 , 则 相应 的 和 是 非 奇 寞 方 阵 。 

证 明 充分 性 ， 落 4 一 XX ， 则 对 于 任 一 六 维 非 零 语 量 x， 

4 一 

从 而 4 半 正 定 , 若 和 非 奇 异 灶 ,， 财 当 x 关 0 时 和 <* 关 0。 上 式 恒 
大 于 0，4 是 正定 的 ， 

必要 性 : 若 4 闭 正定 ， 妥 的 特征 根 为 de" 9 人 0, 甚 
中 之 0G 一 1,，…*,r》)、 于 是 存在 pf Xx 了 正 交 阵 了 一 《PP:)。 
其 中 Pi 是 Pxr 阶 ,P， 是 Xp 一 r) 阶 ， 使 得 

A PdiagChs ho0 DP = Pdiagths :+ * ,4,)P, 
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启 关 一 Pdiag(Vi rw )， 则 4 一 XXX 成立 .车 4 正 


定 ; 则 关 一 ,diagCV WV 2p ) 是 非 奇 异 的 ， 重 
推论 3.1 设 4 是 正 完 矩阵, 则 4: 也 是 正定 矩阵。 
证 明 ”按照 定理 38 的 证 了 ,可知 

AT:— Pdiag(Ar', 17 
其 中 PP 正 交 矩阵 ?请 二 将 0,， 全 区 正定 .由 
定理 3.10 没 4 一 (4 ) 是 ? 阶 对 称 隆 ，Au 是 阶 非 


12 
21 22 


奇异 对 称 阵 〈r 把 让), 则 4 是 正定 的 充分 必要 条 件 是 A 及 4 一 
4 一 ddd 正定 ， 

证 铀 令 x 二 《xi，x;》 ,其 中 x, 是 7? 维 向 量 ,x; 是 ?一 7 
维 问 量 。 由 于 


1 ( I 9 (4 "1( 人 
4 0 1 


x Ax = xt A Avxsy A A ANX) + XdyX. 
如 果 A 4 正定 , 则 4 显然 正定 。 反 之 :车 4 正定 ， 由 定理 3.8 
的 证 明知 4， 也 正定 .。 对 子 尾 给 的 非 堆 向量 xz， 只 须 令 和 一 
一 看 Awxs， 可 知 XIAixXs 这 0， 帮 4 正定 ， E 

在 定理 3.8 的 证 明 中 我 们 有 ; 正定 阵 4 可 表示 为 

4 一 下 diagf(2 207。 


若 取 B 一 PdiagCVN,… ,V4s)P, 则 B 是 正定 阵 ,月 4 一 六， 
以 后 将 称 上 述 8 是 4 的 平方 根 和 矩阵 ， 记 为 B 一 A3。 而 B 的 逆 阵 
记 为 4 性 ， 

上 面 的 诸 定 理 讨 论 了 单个 正定 盾 阵 的 性 质 及 其 它 的 充分 必要 
条 件 ， 这 些 性 质 经 常用 到 。 下 面 将 考虑 与 两 个 乞 阵 有 关 的 特征 很 
和 特征 向 量 的 构 念 及 人 性质 ， 

设 有 4 是 对 称 陈 ，8B 之 0. 称 1|4 一 28| 一 0 的 根 2 为 入 相 
对 于 号 的 特征 报 ， 相 应 于 该 而 满足 《4 一 48)x 一 0 的 商量 
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x 称 为 对 应 于 4 的 4 相对 于 召 的 特征 向 量 . 
由 于 
:4 一 1B1 一 0 <—> | 8 二 4 一 27| 一 0 
所 以 来 4 相对 于 3 的 转 征 很 就 是 求 BY48B8 的 特征 概 ， 
1 1 Sr 一 
设 x 是 85-44B8-a 相应 于 特征 根 4 的 特征 向 量 , 即 
BiAB-ix ~ ix 
那么 
ACB-Ix) = 1B(CB ix)y 
即 3-#x 正 是 相应 于 1 的 用 相 对 于 8 的 特征 商量 ， 
定理 3.11 设 A 是 对 称 阵 ,B 是 同 阶 正定 阵 , 则 一 定 存在 一 个 
非 奇 蜡 和 矩阵 R。 使 得 
B— RR A= RDR 
其 中 D， 是 由 4 相对 于 8B 的 诸 特 征 根 轧 构成 的 对 角 阵 ， 当 4 半 
正定 时 , 诸 4 非 负 ， 
证 明 由 于 8B>0,，B$ 和 8-# 存在 有 正定 ,而 B14B-3 
是 对 称 阵 , 从 而 在 在 正 交 阵 卫 使 得 
BIAB 3- PDP’ 
其 中 D, 是 8-#48- 的 特征 根 也 如 4 相对 于 8B 的 特征 根 构 成 
的 对 前 此 阵 。 令 RR 一 BP ， 则 上 R 显 然 非 奇 异 有 
B= RR A— RD,R 
成 立 。 而 当 4 半 正定 时 ，8 4 了 -二 也 是 半 正 定 ， 从 而 诸 4 非 
抽 ， 和 
定理 3.12 设 4 是 请 了 昼 止 定 阵 ， 一 定 弃 在 一 个 对 和 角 元 素 为 正 
的 下 三 角 竺 阵 T, 使 得 4 一 了 了 了- 
证 明 ”由 定理 3.9 知 年 一 区 。 瑟 ， 其 中 天 是 非 奇 异 矩 隆 ， 又 
由 定理 1.6 知 扰 可 表示 为 XK 一 上 及， 其 中 为 正 交 算 阵 , 民 
是 对 角 元 素 为 正 的 上 三 角 插 隆 。 于 是 4 ~ RR, 令 T 了 一 RR', 定 
理 得 证 ， 有 
在 本 段 的 最 后 部 分 我 们 集中 讨论 与 二 次 型 极 值 有 关 的 不 等 
+ 29 » 


式 ,它们 都 有 广泛 的 运用 。 
引 理 3.1 (Cauchy-Schwarz 不 等 式 ) 
设 二 和 引 是 两 个 产 维 向 量 , 则 
(Bqd} 《本 (本 由) (3.3) 
上 述 等 号 当 目 仅 当 5 = cdt 或 d = c) 时 成 立 , 这 里 6 为 常数， 
证 明 当 5 了 一 0 或 dd 一 了 0 显然 成 立 ， 不 妨 设 8580,d 关 0， 
考虑 向 量 占 一 xd， 这 里 < 是 一 个 变数 ,于 是 
Ob — xd}y(E — xd) 
-= (ddr — (2bd yx +ob (3.4) 
碎 * 的 二 次 函数 些 质 知道 此 时 
bay — (BBYd dd) 0。 


即 (3.3) 式 成 立 ， 

若 5 一 ced， 立即 可 知 (3.3) 式 等 号 成 立 ， 反 之 着 (3.3) 式 等 
号 成 立 ; 则 当 取 * 一 Bdidd 时 (3.4) 式 为 0, 从 而 存在 常数 < 一 
Bdidd 值得 B56 一 ed. 自 . 

引 理 3.2 (推广 的 Cauchy-Schwarz 不 等 式 》 

设 8,d 是 两 个 P 维 向 量 ,B 是 f 阶 正定 矩阵 ,那么 有 

CB'd): < Cb BbYCAdB 1d) (3.5) 
且 等 号 当 且 仅 当 上 5 二 cB"id (或 d 一 cB6)》 时 成 立 ， 这 里 5 常 
数 ， 
证 明 ”由 于 8 正定 ,记名 = 8 动 , d 一 有- 此 时 五 与 十， 
4 d 同时 为 等 向 量 或 者 非 鹤 向 量 , 利用 引 理 3 3.1 于 向 量 台 和 
即 可 得 (3.5) 式 。 量 
1 设 B 是 了 阶 正定 短 阵 ，d 为 乡 维 向 量 , 对 任意 ? 
维 向 量 x 下 式 成 立 
na 人 xd 一 d3'd (3.6) 
:#0 XBx 
且 当 xx 一 5B-d 时 达到 最 大 值 dB- Id Ce 关 0 常数 ) 
证 明 ”六 为 召 是 训 阶 正定 阵 ， 由 引 理 3.2 知道 对 任 一 ? 维 向 
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量 x 效 0, x Bx 之 0 成 立 以 及 
xd) dd 
x Bx 


且 当 x 一 cB-id 时 等 号 成 立 , 定 理 得 证 ， 量 

定理 3.14 设 8 是 f 阶 对 称 阵 ，4i 一 chi(B》 是 如 的 第 i 大 
的 特征 根 ，e 是 相应 于 4 的 互 的 标准 化 特征 向 量 (i 一 1,*………， 
p)，x 为 尾 一 非 零 了 维 向 蛆 , 那 么 有 

1) EB 
XX 


所 (3.7) 


右边 等 号 当 x = ce 有 时 成 并 ;左边 等 号 当 x* 一 《ep 时 成 立 , 这 里 
“ 是 非 零 常数 。 
2)》 记 = er ebp), 


hg (3.8) 
2 pp 此 
当 二 c+ en 时 达到 最 大 值 ,这 里 5 非 零 常数 ， 
证 朋 1) 记 P (a... Cp) 它 是 正 交 阵 , 由 定理 3.1 知 
Bo PdiagCh,** ,4,)P', 


令 y 一 PxiVxx 一 (yyp)， 那么 yy 一 1 以 及 


r pp 
所 一 Jrdiagf2 一 会) 


fel 


于 是 


r e p 
BD 
| EE 


t= 


右边 等 式 当 yy™ C1,0,--*,07 时 成 立 , 从 而 
1 


一 一 必 
xiVxx— Py™ (ees) :| 一 如 
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册 x 一 ze。 左边 等 式 可 类 似 证明 。，3.7 式 得 证 。 
2) 如 时 XE tet ep), 出 ix 一 个 Ci 四 1 sr). 
因此 


y= Px/Vxx = 0,0 yr yp), 
p . 
yy 一 > 好 一 1 
imr+l 


时 F Fp 
xX Bx 
一 一 一 一 > dey? SE rt >) yi oe ht 


下 i=r+l i=r+1 


“ 而 等 号 当 了 一 《0 -5501 0,- 30) 时 成 立 ， 其 中 1 在 * 十 1 位 
置 上 ,同上 可 知 此 时 x 一 ceo 《3.8) 式 得 证 。 让 

推论 3.2 设 有 如 为 P 阶 对 称 阵 ，B 为 fF 阶 正定 炬 阵 , 石 是 有 4 
相对 于 B 的 第 i 大 特征 根 ，e， 是 相应 于 1 的 4 相对 于 号 的 特征 
向量 ,那么 对 性 一 上 维 非 零 向 量 x 有 


x Ax 
21, < 工业 X < 
P xBx 1 


右边 等 号 当 x 一 ce 有 时 成 立 , 左 边 等 号 当 基 一 ce 成亲, 这 里 
是 非 零 常数 。 
证 明 上 电 定 理 3.11 知道 存在 非 奇 异 奸 阵 员 , 使 得 B 一 RR'， 
4 一 RD;R ， 其 中 PD， 是 由 4 相对 于 B 的 诸 特 征 根 4 构成 的 对 
角 阵 。 令 y 一 Rx， 则 有 
xAx yDy 


一 = 


XBx yy 


由 定理 3.14 知道 


1 < EAX < 
x 


‘Bx 


且 当 了 一 c 色 时 右边 锋 号 成 立 , 其 中 色 是 D， 相 应 于 入 的 特 
征 向 量 , 即 Cf 一 Dry 一 40 的 和 解 。 由 
《2 — Dy ~ 0—>ROLT— DDR'X 07 BB — A —0 


se 3 


知 紫 时 相应 x 正 是 相应 于 大 的 4 相对 于 召 的 特征 向 量 a 也 即 
当 x 一 cel 时 右边 等 号 成 立 。 其 他 类 似 可 证 。 多 


$ 1.4 ” 抵 阵 的 微分 及 其 变换 的 Jacobian 行列 式 


在 通常 的 高 等 数学 或 数学 分 析 教 程 中 我 们 讨论 过 对 自 变 量 分 
副 为 一 维 赤 数 或 畏 维 向 时 时 它 的 函 玫 的 微分 表达 形式 。 而 在 本 节 
我 们 将 把 上 述 概 念 推广 到 自 变量 为 一 继 变 数 ,了 维 向 量 或 者 人 矩阵， 
而 因 变 量 为 一 维 变数 ，4 维 向 量 或 者 短 阵 的 各 科 情 总。 同时 讨论 
当 自 变量 和 因 变 量 分 别 为 相 富 维 数 的 向 量 或 者 相同 阶 数 的 矩阵 时 
有 有 关 变 换 的 Jacobian 行列 式 。 这些 知识 对 于 "多 元 分 析 ” 教 程 的 
学 习 是 十 分 重要 的 ， 尤 其 在 导出 随机 和 矩阵 的 分 布 密 度 时 起 着 关键 
作用 。 另外 本 节 在 推导 有 关 的 结论 时 运用 了 一 些 数学 上 的 技巧 ， 
这 些 方法 都 是 很 有 启发 性 的 ， 

《一 ) 经 阵 的 微分 

我 们 将 按 自 变 量 的 各 种 情况 (一 维 变 数 ,向量 ,矩阵 ?分 别 讨论 
有 关 前 数 ,向 量 函 数 及 矩阵 前 数 的 微分 表达 形式 ， 


(1) 窒 变 量 是 一 维 变数 >。 ” 
二 若 ? 了 一 人 7》 是 > 的 向 量 通 数 , 则 记 

dy dy dye 下 

dx -( 季 dx ) 


为 3》 对 * 的 导数 向 量 ,而 


fF. 心 一 ( 宏 or dx | 
表示 向 量 ?的 徽 分 , 它 仍 是 一 向 县 
加 者 YY 一 了 (x) 是 * 的 什 阵 函数 ,其 中 了 = (yi) 是 PX 

9 阶 知 孟 ,那么 


d¥ (2 
dx dx /ps 


是 了 对 * 的 导数 矩阵, 它 仍 站 了 x 4 阶 矩阵 ， 
ns 了 了 。 


面 
{ds 
adY (区 dz) 
表示 引 阵 Y 一 F(x) 的 微分 托 阵 ， 
《22 自 变量 是 丘 维 向 量 x 一 (x 
中 着 yy 一 f(x) 是 * 的 一 维 函 数 ， 通过 令 YU Ss ls 


st "Xs 为 常数 对 x; 求 导 可 求 得 关于 x; 的 偏 导 数 , 记 为 让 


(或 2) 此 时 y 关 于 x 的 偏 导 数 向 量 记 为 


光一 (区 
Ox Bx "Ox, 


如 果 令 
of (FY 2 . 
Be (入 和 dx 一 (dz deoy 
风 ?了 一 六 x) 的 微分 为 
df ~ 8- de— Dn C4.1) 


> Fe Dr 


四 着 yy 一 (0,… ,J》 基 向 量 x 的 4 维 启 量 活 数 , 即 yy 一 
Hx CG 一 1 和 简 记 y 一 fx)， 那 么 规定 y 关于 x 的 
诸 偏 导数 构成 的 算 际 为 . 

ay) by By 

Gx 一 人 
By ,.. Oy 
dx, 人 xp 


dy, Oy, 


F 


若 记 dy 一 【ay dy), 它 是 一 个 向 量 , 那 么 J 关于 * 的 微 
了 


分 为 


2% A 
dy Hx ay 
dy 一 | ， |=1 : 一 刺 邓 dx, 
La 于 他 x) 
dy Oy, | 
本 EP 


国 若 了 一 (yy) 是 #X 坟 类 降 , 而 yi 一 寺 (x)， 称 了 基 了 席 
量 x 的 短 阵 孙 数 , 记 为 了 一 F(x)， 那 么 类 似 上 面 了 关于 x 的 
微分 仍 是 一 个 * x 各 矩阵 


dY = dFOX) 一 (2 dx) 


我 们 记 


OF _ (9fu(x). i 
a ( EE ) lp) 


为 了 关于 x 的 侦 导 数 和 矩阵 , 那 委 4F 还 可 表示 为 
dp 一 六 -as 
af 
《3) 自 变量 是 疡 X #8 阶 矩阵 X 一 (xij). 
由 yy 一 人 XX) 是 忒 的 一 维 数值 通 数 ,那么 偏 导数 和 皇 降 为 


Bf (8 
BX (让 ) 
仍 为 相同 阶 数 的 先 阵 。 若 记 dX 一 (dxp) 那么 ?的 微分 可 写成 
dy YT gtr (55) ax | (4.2) 


ft fl Ozri; 
| 若 店 变量 是 了 Xx 捕 阶 对 称 和 托 降 ,那么 雇 变 量 只 有 oj (i 守 
技术 处 理 : 记 | 


ox ™ (eae) 


s FF* 


lf 
其 中 5 一 本 
nf 一 仍 同 往常 放 在 对 角 元 素 上 ,而 让- 全 天 为 各 让 一 半 在 


第 Ch 和 Cj 让 的 位 秆 上 。 而 且 灵 续 记 
dX 一 (dxii px 
只 是 现在 dxr 一 dariss 那么 


df 一 bp b> 2 dz 这 让 有 


了 


仍 适 用 ， 
名 若 向 量 yy 一 (ye 是 第 阵 变 数 关 的 向 量 尔 数 ， 见 
和 一 ix) 人 一 【好 那么 


仍 为 一 向 是 
鲜 着 # x 六 阶 矩 阵 了 是 艺 的 一 个 矩阵 函数 ， 即 yz 一 fx(X) 
1 和 YY 关于 多 的 微分 惫 为 一 个 相 


同 阶 数 矩 陈 
人 人) 


下 面 及 例子 说 明 。 

例 41 设 FF 一 GH, 其 中 下 一 【六 门 ， 吕 一 【87。 于 一 
《5 分 别 是 向 量变 数 x 一 《xx 的 托 阵 函数 , 求 dP。 

解 由 F=— GH 和 , jj 一 六 api 而 
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Bf Bg, 让 By 
ee pi D) ga 
Ox 之 Or " 之 8 Dx 
于 是 
OF _ DG HG. OF 
Ux Ox Dwe 
由 此 可 得 
dF— 》) PR dx 一 【dG) 亡 十 人 fd]。 
刀 


与 通常 图 效 慎 积 求 微分 有 相同 形式 . 
例 4.2 已 知 革 一 (xj) 是 一 对 称 非 亲 异 方 阵 ， 求 一 
的 微分 ， 
解 由 于 XR 一 上， 所 以 
了 和。 下 十 XdR 一 0 
dP 一 一 XI， dX. Xt 
例 43 设 并 XX) 一 wwXX Tq， a 是 常数 启 量 ， 多 一 (xw) 是 


i 8 
对 称 非 奇异 方 阵 , 求 6 


解 ” 首先 从 定义 容易 验证 dtr(XX) 一 trCdX)。 于 是 
dfCX) = dtr Ka)] = trldloa Xa)) 
mm tria - dX i al = tria XxX tT dX Xie gq) 
= tt—X Aaa XdX] 
这 里 利用 XX 对 称 人 性。 出 《4.2) 式 得 到 


注意 : ， 求 抢 阵 变数 的 函数 的 偏 导数 矩阵 常用 例 4.3 方法 ， 即 


ae -of 
a 上 一 区 一 一 一 一 3 
下; 求 出 df trCad dXy, 那 友 元 二 。 


例 4.4 求证 dXX| 一 [XitrCXTidK). 
证 明 ”由 定理 1.2 知 , 若 记 人 一 《xz， 那 各 %5; 所 对 应 的 


a 漂 人 全 


代数 余子 式 正 是 ACi,7) 一 .| i, 由于 
IX| 一 D2 ziACi,)) 
所 以 


如 | 无 | 


一 Ci 站 一 | 着 | 。 基 
Be (Ci) = Xl * 


于 是 

dXi = DS) HD) IXI eidrs = {XI + txX dX), 恒 

读者 可 自行 验算 下 列 微 分 公式 ,其 中 X,Y 为 矩阵 变数 ，4， 
8B 是 常数 什 阵 ， 

1Y tr 大) = tridX). 

2) A AXY) = AdX. 

3) dXYY = dX YY + XdY., 

4) AXDY) — dXDY + XOUY., 

5 dH BAXYI— (AX) + BX+ XB.* CdXY. 

6) a(trX AXB) 一 LLCB'XA + BXAYAX), 

7Y dCin {XX|) = tA WAY), 

在 上 述 2) 及 ) 式 中 若 令 五 一 x 是 一 向 量 , 则 可 推 由 


AX) 4 C4.3) 
Ox 
以 及 
Ox 号 并 一 《了 十 B’')x 
dx 
特别 当 召 是 对 称 和 矩阵 时 有 


2 Bx ca 28% (4.4) 
x 


(二 》 矩阵 变换 的 Jacobian 行列 式 
二 面试 究 变换 的 Jacobiaa 行列 式 ， 在 多 元 分 布 的 推导 过 程 


。 338。 


中 常常 在 积分 号 下 作 蛮 换 , 这 时 必须 计算 它 的 Jacobian 行列 式 ， 
考虑 积分 


| ECX) dx OER 
其 中 一 《x40…… ,#9》， 作 变换 y 一 x). 有 好 阅 一 人,*……， 


9 敌 一 大 人 一 1 四。《 当 逆 变 换 存 在 时 记 x 一 
广 (Ky7)。 轩 微 积 分 知识 知道 上 面积 分 可 化 为 


[sD ydy (4.5) 


其 中 积分 区 域 了 一 {y:y 一 (x),xe 0} 


1x =>y)— ge 《141， 表示 行 询 式 | 4 | 绝对 值 ) 


J(x 一 y) 称 为 变换 的 Jacobian 行列 式 ， 
注意 到 这 里 自 变量 x 和 因 变 量 ”有 相同 的 维 数 。 
若 y 一 f(x), 计算 Joy 一 x) 常用 下 列 方法 由 于 


— Cy) 
iy B(x) dx 


我 们 不 妨 把 dy 用 成 dx 的 线性 函数 ,由 矩阵 微分 性 质 2) 知 它 相 


Oty) 
应 的 Jacobian 行列 式 下 是 5c | ， 于 是 有 


Ty x)— Jy dx) = {lx -yy1}” (C4.6) 

如 果 自 变量 XX 和 因 变 量 Y 部 是 ?x8 阶 矩 隆 变数 、 则 遂 澡 用 
_ | OvecY ) 

了 了 一 区) OCvecX) |, (4.7) 


来 定 光 从 了 到 成 的 变换 的 Jacobian 行列 式 ， 
“定理 41 对 于 i 一 1,.……,n， 规定 下 列 条 件 变 换 
yi xX Xe) 
一 Fu Wis 


i 


J ™ fyi x,) 
* 9 + 


其 中 x; 和 y; 都 是 9; 维 向 量 , 且 y， 表达 式 中 不 显 含 xi， 
XxX;-， 那么 有 


J Ys Ny a) 一 II J Yi —* Xi) C4.8) 
tel 
证 明 对 y; 求 微分 得 到 


于 一 1 3 
间 HF 

dy: = -一 dy; 十 

2 包 Oy; 7 名 


Bf gxy Gls) C4.9) 
Ox} 

车 记 区 《xi 了 《iv “0 它们 都 是 3 对 维 
向 量 


dx = (dr) se CAR)) 一 《Cd 
并 记 


Tw “-。 人 一 | ， “ 
0 
那么 上 述 方程 组 (4.9) 可 改写 成 
Gdy = Tdx 
注意 到 GG 是 对 和 角 元 素 全 为 1 的 下 三 角 和 矩阵 。 非 奇异 县 181 = 1， 
所 以 
dy = GTdx 
Ji Xi "sn) iy —x} 
一 GT 一 1G3 ITI = IT|+ 
* 0 。 


= II | 了 站 + = [HI jyi > Xi). 上 
和 一 1 了 mm1 


定理 42 设 yy 一 fx), x 一 多 xz)， 其 中 x,y,z 都 是 = 维 
向 量 ,那么 


JU 一 2 一 KK3y xX) TIx 2), 

证 明 ”通过 取 微 分 知道 
Cf) _ Og) 

dy Bc dx dx Cz ds 


x) 
所 以 
-a .ag) 
‘yxy) az 亿 
因此 . 
,| | .18Ce) 
(yz) = Jdy — dx) [25 "|acz) 


= yx) Hx—z), 
上 述 定理 4.1 和 定理 4.2 在 求 变换 Jacobian 行列 式 时 很 有 用 
处 ,往往 比 由 (4.7) 式 直接 计算 要 方便 得 多 ， 下面 举 出 一 步 实例 。 
例 4.5 证 明 下 列 球 坐 标 变换 
2 时 中 
2 reosd,sind, 


《4.10) 


Xi 一 rcost :cosd, sin 0 


Xo cosD*** ,cos Op.1c03 0 


的 变换 Jacobian 行列 式 为 - 
”—1 
za sp raBis* 09-:) re I (cosO eT 
i= 


证 明 ”为 了 利用 定理 4.1, 把 上 述 变 澳 变 形 为 
a 1» 


fi sind 一 hr ,0,, “"* 6,1) 
让 者 rictgB sia 包 一 fx Bs Oo) 


ki = tctgOr a sin Oi fA sts O01) 


2 Wp 1ctgOp 1 fplxis xpi Op-1) 


于 是 


p—1 
下 rr)* I{ Tr > 0:1) 
j= 


PP 一 
“ 天 -> 0,.1) 一 sin。 II wi sin Bi) sin O° pl 
[| 


"Caind, 1)™ 
将 (4.10) 式 代入 ,消去 庄 sinb, 得 到 
J Rs 3p ry" py 
= pif cos OP HH cos) ,cos 9.:) 


pi 
w= ppl II Ccos0)ti! ,四 
二 


推论 4.1 令 了 和 区 都 是 #» x P 阶 矩 阵 变数 ， 并 满足 关系 式 
Y 一 4， 久 :8， 其 中 4 是 # 阶 非 奇异 方 了 泗 ，B 是 ? 阶 非 奇异 方 
阵 , 那么 . 
JCY > X= 141s 1B1: . 
证 明 令 7 一 (3 ype) Xs Kp)s 若 了 一 
地 万 则 


HARX > X= Ty > x) THAdtr = lA 


同 理 者 了 一 XB， 内 须 考 虑 行 向 量 , 则 有 
I(XKE + X) = | 日 3。 
于 是 由 定理 4.2 求 得 


网 


NY 一 无) 一 JAXB—> XB) XB—>X)= At: 1B 
注 : 推论 41 也 可 利用 定理 1,1 证 明 , 即 了 一 AXB 可 路 写 
”的 vecy 一 CA 的 HvecK， 按 (4.7) 


KY 2 = |e -488 ~ A113 


.定理 4.3 ” 令 下 和 了 厂 是 两 个 * 阶 对 称 握 阵 变数 且 满 足 
F= AWA 
其 中 4 是 # 阶 非 奋 蜡 息 阵 , 那 么 
NV =W)= [A4 Enti oo | 4), 
证 明 ”由 于 交换 4 的 诸 行 ( 列 ) 时 ， 只 须 殷 的 诸 行 ( 列 ) 作 相 
应 突 换 而 TV 和 的 关系 不 变 。 又 因为 4 非 青 恰 ， 不妨 设 4 诸 i 阶 
主子 行列 式 都 不 为 4, 由 定理 1.7 知 4 可 分 解 为 4X 一 TU, 其 中 了 
为 下 三 角 第 阵 , 0 为 上 三 角 矩 联 ,因此 
下 一 了 TD We UT = TWT (A 中 W, = UWUD) 
(4.11) 
从 而 
NVW)- IT >W)* IW— W). 
不 妨 设 4 为 下 三 角 和 矩阵 TT， 我 们 用 归纳 法 证 明 ， 
当 阶 数 为 1 时 ， 定 至 显 然 成 立 。 设 阶 数 为 = 一 1 时 定理 也 成 
立 ,那么 当 阶 数 为 了 时, 把 变换 写成 分 瑟 形 式 : 


Ves 直 Ty VW eTu £ 
Ye 
其 中 直 和 + 上 是 ?一 1 纵向 量 ，Tu 是 * 一 1 阶 下 三 角 算 阵 ，w， 
na， 刀 是 常数 。 把 上 式 改 写成 
Va™ TuWuTu 
B= TWut+ Ty*ers, 
sir thott twt 
正 是 条 忻 谈 换 式 , 按 定理 4.1 有 
AV Wm VW Too) Hy Ww) 


| 


容易 计算 得 到 
Hb— ee) = TIT,|+ ia 和 一 
由 归纳 法 
JU Wu = | Ta 
所 以 有 
FF WIT [Tus had TI! 
类 似 地 当 4 为 上 三 角 年 阵 芝 时 , 则 有 
NV WY)= IU 
按 44.115 式 立 芭 得 到 
NV—>=W)= V2 WD)* NW W) 
— iTin v4 
*' 定 理 44 设 $S 是 2 阶 正定 矩阵 ， 且 85 一 了 了 *T'， 其 中 了 
县 具有 正 对 角 元 素 的 下 三 第 和 矩阵, 那么。 


办 
JS— T= 2# Ti C4.12) 


证 明 利用 归纳 其 。 当 阶 数 为 1 时 5 一 疝 ， 于 是 
J 1) 一 28 
《4.12) 式 成 立 。 设 阶 数 为 一 1 时 定 再 成 立 ， 当 阶 数 为 P 时 ，s 
是 了 阶 正定 绰 阵 ,由 定理 3.12 知道 存在 对 角 元 素 为 正 的 下 三 角 惩 
阵 了 使 得 3 一 了 工 * 了 ， 和 将 它 用 分 起 形式 表示 
Sy 是 Tu BB /Ty vv 
( | ) 一 人” ， (oo 了 
其 中 ww,v 基 P 一 1 维 向 量 ， 了 ;是 是 一 维 变数 ，Th 是 对 和 角 元 
素 为 正 的 了 一 1 阶 下 三 角 算 阵 , 即 
Snu™ Tuy* Tu 

村 一 下 1 

pm 二 
是 条 件 变换 式 , 按 定理 4.1 ,有 

AS 一 了 一 3 一 了 1 


。 ?4 。 


容 锣 求 得 
pei _ 
Ta = Tl = [8 dsp £20) ~— hie 


由 归纳 法 


J Tn) ~ 277) Il 1 


于 是 


Pp—1 


pl 
JS 一 了 = 207 TE sf TL si 2190 
ful 


ral 


一 27 ， II sh, | 
《定理 4.5 设 了 是 一 个 如 阶 焉 定 和 矩阵 变数 ， 了- 是 它 的 邀 
阵 , 则 
JOV 一 到 -9 VI 
证 明 记 玉 一 V7", 则 VW=1. 所 以 有 一 一 4 :WwW 
即 
aV — —Vdaw :Vr 
利用 C4.6) 式 和 定理 4.3 可 得 到 
IV > WY dV dW) {V+ 
注意 着 7 是 乡 阶 非 少 异 宙 阵 , 那 么 JCF 一 VV 一 VI 于 ( 册 
本 章 习 题 16) 


- 习 题 一 
4.1 计算 行列 式 ; 


1 # a 

a 4 pp 1 -pp 
: 人 ; 5) 1 2 3 
1 Fm 2 CE 9 2- 1 


1.3 求 下 列 方 阵 的 过 婚 际 : 
a 设 Dy = diaglpioropa}y P= CPs pe)'s 
(> Pi<ls pi>0s i 1 ey ) 


FD-p'p, 


VV-! 
求 二 间 | ,， 
VF = Ca Wi = { 、 
3 上 
求 六 。 


提示 : 利用 (2.7 式 。 
1.3 证 明 ;， sg) fkCABY = rt¥(Ad' dB) 一 TKC ABB'Y:; 
bY) [rk dy 一 TE 呈 | 六 FECd + BYSErk(CAY + rkeB). 

1.4 设 4 几 悉 为 > 的 mn x 和 m 阶 矩阵 ， 则 存在 秩 为 + 的 sr 阶 短 阵 F 
和 Xa 阶 矩阵 GG，、 使 得 4 二 了 6， 记 亚 一 CCGPF ER 证 
明 号 满足 加 号 逆 的 四 个 条 御 ， 

1.5 证 明 : 着 PP， 是 正 交 阵 ; 则 (CP.APD? 一 PAtPi 

1.6 设 4 是 友 对 称 纸 阵 > 风 4 满足 二 一 一 4 求证 

so) 有 是 对 称 阵 ; 

5) 奇数 阶 和 的 反对 称 阵 行 列 式 为 0; 

*) 反对 称 阵 的 特征 根 必 为 零 或 者 纯 夷 数 。 

*31 ,7 于 下 列 短 阵 的 加 号 道 ; 

( 1 ， 0 1 

a ; 0 1 ol 

， ! 1) ， 0 1 1 

1 设 Bm1 一 江上 € 一 15. 天， Si, = *). 

间 i jel 

Co diag(tCyrmsCt)y DP BB— 人 ty, 一 
其 中 吕 表 示 元 素 和 者 是 1 的 a X+# 阶 矩阵 .证明 : B,C, DD 部 是 对 称 宕 等 
阵 ， 

1.9 车 4 荐 pf x4# 阶 答 隆 ，, 是 4 x ?了 阶 矩 隆 ， 证 朋 A483 和 84 有 
相同 的 非 零 特征 根 。 

4 .340 


+ #6 


的 证明 如 果 4!,8-! 存在 , 则 (4 罗拉 一 = 48 

5 证 明 tr 的 B) = trAd. trB; 

e) 设 4，B 为 为 阵 ，a 是 4 相应 于 4 的 特征 根 1 的 特征 向 量 ，” 是 
下 相应 于 引 的 特征 根 上 的 特征 向 最 证明: =@o 是 4@@8 相应 于 它 的 特征 
根 2p 的 特征 挡 量 。 

1.11 已 知 X 是 sx mm 阶 矩阵 变数 ， 

na) fCKXY on tr(X'AXBY, 求 BIOX; 

上 HXY 一 ln| 天] : 求 Bf {BX. 

1.12 设 4 和 了 是 两 个 = x. 阶 矩阵 ， 且 多 (A)C(B)y Pa AC4 
-APs 一 8(8'8)-B” 分 别 是 从 R* 到 名 (A) 币 名 (8) 的 投影 息 阵 ， 
证 明 Pa* Pa= Pa* Pa = Pa, 

近 示 : 若 人 (4) ct8)， 则 大 在 P* x # 阶 矩阵 思 使 得 4 = BD. 

1.14 王 明 若 一 个 方 阵 既 是 上 三 角 抑 阵 又 是 正 交 握 阵 ; 那 么 它 一 定 是 单 
位 阵 。 

“1.14 如果 方 隆 和 全 都 是 “x * 阶 反对 称 短 阵 变 数 ， 且 了 = 
4 二 《其 中 4 是 上 xm 阶 非 奇异 矩阵 》 证 明 : 

JCY 一 VD 一 IA 

提示 : 证 明 思 路 参考 定理 4.3。 

941.15 如 果 5 二 了 T，4.T， 其 中 T 是 对 角 元 案 全 为 1 的 下 三 骨 甜 
阵 , 广 4 二 disg(%,,…sXs3，、 证 角 ; 

JK3- Ty AY 一 Ti bh 
f= 
担 示 同 1.14 是 | 
1.16 已 知 了 是 p x 了 阶 非 奇异 矩阵 ，V”! 是 它 的 逆 阵 求证; 
TCF= 产 一 = [Yi 
提示 : 利用 C4.6) 式 和 推论 4.1。 
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第 二 章 ”多 元 正 态 分 布 


从 订 章 起 ， 我 们 将 逐步 介绍 多 维 随机 变数 的 统计 规律 。 在 通 
银 的 数理 统计 教材 ,为 了 强调 随机 变量 与 善 通 变量 之 间 的 状 异 , 往 
往 用 不 癌 的 印刷 符号 来 表示 。 而 在 本 元 程 中 认为 读者 已 其 有 普通 
的 数理 统计 知识 ,不 再 对 随机 变 重 和 普通 变量 加 以 区 别 ,根据 上 下 
文 ， 读 者 是 能 够 自行 识别 和 的， 例如 : EX 表示 随机 答 阵 的 数学 


期 望 , 而 密度 fCX》 一 c。， exp| 一 十 trXX 中 天 则 是 普通 的 矩阵 


变数 。 今 后 总 是 用 大 写字 母 表示 息 降 变数 ， 以 小 写 黑体 字母 表示 
向 量 ,向 小 写 普通 字母 则 央 示 一 维 变数 . 

在 多 元 统计 分 析 中 ,多 元 正 态 分 布 占 有 很 童 妥 的 地 位 ,这 一 方 
而 是 由 于 自然 界 中 有 许多 随机 现象 确实 服从 多 元 正 态 分 布 ， 或 者 
根据 中 心 极 限定 理 可 推出 许多 实际 问题 中 出 现 的 多 元 随机 变量 浙 
近 地 服 从 多 元 正 态 分 布 。 另 一 方面 是 因为 有 关 多 元 正 态 分 布 的 理 
论 研究 已 经 相当 深入 ,有 一 整套 的 统计 推断 方法 ,这 些 方法 和 研究 
结果 在 实践 中 已 被 证 明 是 十 分 有 效 的 。 为 了 更 好 好 讨论 多 元 正 态 
分 布 ， 我 们 将 在 本 章 第 一 节 中 先 回 顾 一 下 多 元 随机 和 高 量 的 分 布 及 
其 性 质 ， 然 后 对 多 元 正太 分 布 本 身 省 关 的 统计 特性 进行 比较 共和 人 
的 讨论 .而 在 以 后 的 几 章 中 将 进一步 研究 与 它 密切 相关 的 其 他 多 
元 分 布 并 讨论 有 有 关 的 统计 推 煌 问 题 ， 


$2.1 条 元 随机 向 量 及 其 分 布 


《一 ) 随机 向 量 及 其 分 布 

有 些 随 机 现象 ,不 能 仅 用 一 个 随机 变量 来 描述 ,而 这 同时 使 用 
几 个 随机 变量 才能 金 面 描述 。 例 如 菏 种 地 质 样品 ， 我 们 就 必须 了 
解 其 中 铜 、 锌 、 铅 等 元 素 的 含量 及 它们 之 间 的 关系 才能 作出 比较 舍 
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理 的 接 业 。 这样 我 们 就 必须 对 随机 沿 量 进行 研究 。 

设 zt *，z 是 所 个 随机 变量 ， 由 它们 构成 的 向 量 x 一 
《xz "py 称 为 了 维 缆 机 向 量 。 它 的 统计 特性 完 爹 是 由 它 的 联 
合 概 率 分 布 或 分 布 函数 所 决定 。 当 然 我 们 也 可 以 对 随机 向 量 的 分 
量 各 外 进行 研究 。 人 我 们 将 看 到 ,如 果 作 为 一 个 整体 进行 研究 ,不 
仅 能 了 解 各 个 分 量 的 性 质 ， 而 且 可 以 著 查 各 随机 分 量 之 闻 的 统计 
联系 ,可 以 更 深刻 地 贺 示 随机 现象 的 本 质 。 有 时 为 了 需要 , 常 把 许 
多 随机 变量 整理 成 矩阵 形式 .如果 一 个 *# X 了 阶 答 阵 XX, 它 的 每 
一 项 都 是 随机 变量 ， 则 称 基 是 戎 机 乱 阵 、 由 于 算 阵 可 以 拉 长 成 向 
量 ,故我 们 今后 着 重 研究 随机 疝 量 。 

定义 11 设 x 一 《za …，x)》 是 ? 维 戎 机 向 景 ，y 一 
《yi "yp》 是 了 维 实 数 向 量 , 称 ?元 图 数 

Fy yy) 一 Px = Yi yp) 
为 的 联 人 台 分 布 通 数 . 记 作 x ~ 

给 出 了 联合 分 布 函数 ,那么 x 东 在 Rr 中 任 一 立方 体 ie 
中 的 松 率 可 以 通过 进行 计算 ,其 中 aa 一 (ai 97， 上 一 
《本 bBo), Bb i by Cm 
Wp)E RFE bp}， 


Plx € {re,s)} 3 忆 (xay yz 


一 > F(xisg "sxp) 会 AreeP (1.1) 
其 中 4 一 人 Xp); 其 中 只 有 偶数 个 二 取 ay， 其 余 x 职 
bi}, B= 人 ze kp) 其 中 只 有 坷 数 个 # 取 4;， 其 余 点 本 
}。 例 如 妆 P 一 2 时 
Pl{a, < E bs ar < 二 3 < Bb,} Plbsb,) 十 Fla,a) 
— Flasb) — Flassb) 
定理 1 没 F(x) 一 Fin:-…… ,zy) 是 了 维 分 布 沙 数 , 它 具 
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有 下 列 伺 质 
1)》 对 每 个 自 变量 ，FCx ;xp) 是 x 的 单调 非 降 左 过 

续 函 数 (i 一 1,2,.……,p). 
2) 0 下 CR < |。 
3) 对 任意 i(i 一 1, -2)， 


下 一 jim F(as “te) = 必 
一 


以 及 F(+00,-.…, T+) 一 lim Flrs'**,s) ™— 1. 


4) AlceP 尖 0 (其 中 a、b 满足 (1.1) 式 中 的 要 求 ). 

反之 , 藻 一 ?元 函数 F(z) 具有 上 述 各 条 性 质 ， 它 必 为 某 一 
维 随机 向 量 的 分 布 函数 。 定 理 详细 证 明 可 参考 35]、 

与 一 元 随机 变量 一 裕 ， 对 于 维 随 机 向 量 我 们 主要 研究 离散 
型 和 连续 型 两 类 ， 

定义 1.2 如果 维 随机 向 量 x 一 (%，… sx》 的 每 个 分 量 
部 是 一 维 离散 型 的 , 则 x 称 为 离散 型 的 。 

如 果 存 在 非 负 的 ?元 郊 数 f(x), 使 得 x 的 分 布 函 数 RCx) 
可 以 表示 成 


Fw- ~ -xp 一 亿 小 大 sp dr "drs (1.2) 


则 x 称 为 连续 型 的 而 信 x)》 为 x 的 分 布 密度 函数 ,简称 密度 . 

对 于 离散 型 蝴 机 向 量 , 常 用 它 的 概率 分 布 代替 它 的 分 布 函 数 ， 
设 x 一 (x,-**，z*s》 的 取 值 范围 为 点 (ej? ，，…*，e$P》 其 中 
ns 可 以 是 有 限 或 者 可 数 个 ,那么 由 

pei sp) ™— PX = di), * “yp 一 好 站) 了 《1.3] 

全 体 组 成 了 x 的 概率 分 布 。 此 时 有 

1) 如“ “ "sis) 2 0。 

2) Zp Ci ，-…*， fp) 一 1 《 求 和 是 在 x 金 体 取信 点 上 进行 
的 

3) x 的 分 布 咕 数 

和 本 站 


.下 


FP (ys “ J = Sp (Ci, - 1 《 求 和 是 在 区 域 用 二 
的 各 7 上 进行 的 ， 

例 1.1 【《 客 项 分 布 ) 著 随机 同居 x 一 《2 ,x*》 满足 下 列 
条 件 


iD zx; 空 0 取 整 将 , 且 > wi 一 大 
f= 
二 ) 设 a。 一 《os……， 4》( 其 中 i 为 非 负 整数 是 了 as) 


1 二 里 
#1 


ai 


PP0 Pr 


Pl 一 a 


其 中 0< pi < 1， 且 >) P=1, 则 称 随 机 向 扎 Ex: wii 
了 一 1 


xD 服从 参数 为 (六 -的 多 项 分 布 , 记 为 训 一 PNGCas 
PP-1)。， 注意 到 x, 的 取 值 完全 由 xp， 32- 和 # 决定 
的 《例如 当 ? 二 2 时 为 的 分 布 就 是 二 项 分 布 )。 有 时 也 记 为 
PN Pr). 

对 于 连续 型 随机 向 量 ， 通 常 研 究 它 的 分 布 密度 。 ?了 维 随机 向 
量 x 的 密度 (xX) 一 f(z-…*y%p) 具有 下 列 性 质 : 

i) fx) 2 0, Vx Ee R?; 

ii) ferfCx)dx 一 1 

ii 对 于 R? 的 任 一 集合 8 有 

PlxE BB) | fx)ax; 
iv) 如 果 az 是 信 x) 的 连续 点 ,那么 


a 


外 
HX) 一 丽人 Xp 


Fn 


其 中 F(x》 是 x 的 分 布 前 数 ， 
C#)》 严格 地 说 , 8 此 是 RF 中 的 Borel 可 浏 集 ， 以 层 提 萎 的 供 仿 出 育 相 辣 的 说 
由 :不 上 髓 一 一 增 贡 ， 


=。 5 


反之 ,如 果 一 个 睛 继 非 负 可 油画 数 fCx)》 满 是 1 和 it， 那 

委 由 
已 (和 rp) ™ 全- oi Fa stp Yd “dt, 

定义 的 壹 元 函数 一 定 是 某 一 随机 向 量 的 分 布 函 数 , 而 jCx》 是 它 
相应 的 分 布 密度 。 

例 12 二 维 随 机 向 量 x 一 (zym) 有 具有 密度 
e st x > 0, x > 0, 
0 其 他 ， 
那么 容易 验证 f(xusw)》 满 是 性 质 i) 和 )。 且 此 时 相应 的 分 布 


| en ee TD S00 
F(xiyti) — | , 
‘ iy 2) 9 | 其 他 . 


最 重要 的 多 元 分 布 一 -多 元 正 态 分 布 将 在 下 节 详 细 研 究 。 
(二 ) 边缘 分 布 . 末 件 分 布 和 统计 独立 性 
跌 然 获 机 向 量 x 的 分 布 函数 完全 秘 划 了 它 的 统计 特性 ,那么 
加 本 由 x 的 分 布 虽 数 求 得 它 的 子 向 量 的 分 布 函 数 电 ?为 了 方便 
地 用 符号 表达 ,我 们 总 假定 取 子 向 时 是 由 x 的 前 7 个 分 重组 成 的 
(或 后 ?一 ?个 分 量 组 成 的 )。 即 
X= (XxX,， XK) 其 中 一 (44 和》 是 r? 维 向 量 ,，x, 一 
《zt sx 是 了 一 ? 维 向 量 , 记 x 的 联合 分 布 函 数 汶 
F(X， 于 是 对 任 一 7 维 实 数 向 二 yy 一 《ys:** ， 事 件 
{ ps Ys 
pt 二 十 0} 
岂 分 布 沙 数 定 疼 及 概率 的 连续 性 可 知 
PyD = 下 所 Ji 
一 下 到 为 
+ lim A 


Fpt+ds op 


fz) — { 


,2 


= Ply ys 00 ,00), 
竺 别 x 的 枉 一 分 最 六 的 边缘 分 布 汶 

FAY) 一 F(T to Yio, ,00) 

全 一 工 - sp). 
对 于 离散 型 随机 向 量 x。 若 它 的 概率 分 布 为 
PO Al sy GPP) — pi ip), 《1.47 
那么 x 一 《zx)》 的 边缘 层 率 分 布 为 

Pio 


jr Le 
一 pi, ~ si) 
如 果 x 是 连续 型 贿 机 向 量 ， 它 的 分 布 密 讼 为 f(x) 一 1x,， 
“kp), 那么 天 1 《Xi 3 的 边缘 分 布 函数 为 


站 2 一 他 。 -全 | 。 -人 fr fo)dr* dt,, 
扩 忆 x， 的 边 绢 分 布 密度 为 
px) = fm) = | ms, 


Ftis py。 : C1.5) 
这 里 要 注音 : 如 果 x 有 密度 ， 则 它 的 任何 子 向 量 的 边 绿 分 
布 都 存在 , 且 可 出 (1.5) 来 求 出 相应 过 绿 密度 ， 反 之 , 若 x 的 边缘 
分 布 都 有 密度 存在 ， 并 不 能 推出 x 有 密度 ， 另 外 ,即使 人 x) 形 
式 十 分 简单 ,由 于 (1.5) 式 是 多 蛋 积 分 ,边缘 密度 h(x) 形式 可 能 
很 复杂 ,甚至 于 没有 好 的 解析 表达 式 。 
例 1.3 在 例 1.2 中 可 以 让 算出 罗 和 六 的 边缘 分 布 函 煞 为 
天 1 一 《一 
它们 的 边缘 分 布 密度 汶 
0 
例 1.4 设计 过 《xi 2 sXe) ~ PN 那么 
对 任 一 sc<ry 有 
i) 《za “” "1) ~ PNCn, ps “ops; 
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UY si ~ Blns pI i l,i 
县 体验 证 留 给 读者 自行 完成 . 

下 潮 我 们 复习 有 关 条 件 分 布 的 概念 ， 烷 件 分 布 是 一 个 很 量 缕 
向 概念 , 它 是 条 件 概 率 的 推广 , 

车 有 4 和 上 8 是 事件 , 上 且 P(B8) > 0,。 在 如 发 生 条 件 下 4 的 条 件 
概率 定义 为 


PtAB) 
PCBY 
取 4A 一 {gw B= [aR 其 中 ;入 是 
随机 变量 ,4 所 外 人 一 1 2)， 且 2 有 盖 0， 于 是 
Pi 和 bb) 
Pa 和 < 了 


P(AIB) 一 (PILB) > 0)。 


P(E 和 一 


C1.6) 
设 x 一 《区 》 是 一 个 二 维 随 机 向 量 , 我 们 考虑 当 x， 取 定 
加 时 的 分 布 , 即 PCs 过 如 | 一 3)》 称 为 % 在 一 下 的 条 
性 分 布 。 . 
若 x 是 离散 型 的 , 它 的 概率 分 布 为 


Plx Ga， Xi 本 人 pliisia). 


过: 的 边 乡 概 率 分 布 为 P(x 一 cg 一 pi) 一 之 PCiisiz)， 那 


入 在 x 取 定 as 时 + 的 条 件 概率 分 布 为 


Pix 友和 ?1 xz 一 gD) pitia) Chti) > 0). 
pli) 
车 x 是 趟 续 型 的 , 它 的 审 度 为 fx,x;)， 而 ' *% 的 边 绿 密 度 
为 fs 那么 由 (1.67) 式 知 


ff fw, sDames, 
Pla < x 人 b,|a; < Xz < 六 au 1 


| fa sn) ds, 


nn S54 . 


当 《6 cz 是 其 aa ta) 的 连续 点 以 及 fF2 是 ftw) 的 连续 点 
时, 令 5. 一 22， 和 一， 利用 中 伸 定 理 可 知 , 当 上 (oa 之 0 时 ， 
则 Flo) 一 Haya)ffa)。 用 【om 做 《ae， 得 到 在 
和 给 定时 2 的 条 件 密度 为 
fCals) — KA) Cf) > 0) C1.7) 
fa x2) 
更 一 般 地 , 当 x 一 (x,,x;》 有 密度 扩 x1, x;)，X， 有 边缘 密 
度 Pr) 时 , 当 x 是 作 x) 的 连续 点 ，x， 是 fxs 的 连续 点 
时 , 则 当 x， 给 定时 xi 的 条 件 密度 为 
fa) ~ KX) Cx) > 0 (1.8) 
fCxs) 
若 x 一 (x',x;) 是 高 散 理 的 , 则 x， 的 边 绿 分 布 也 是 离散 型 
的 ,及 x 和 2 的 概率 分 布 分 别 为 


Px = dD ys — a9) pis ip) 
和 Plxt 一 Cd “yp op 一 pi "ste), 
那么 在 x+ 一 dry 人 wp 条 性 下 x 的 条 任 概 率 分 布 
为 


Pr 一 qi 
一 Pirate) C1.9) 
Cr fp) 
最 后 我 们 讨论 随和 机 向 量 的 相互 镍 立 性 
设 x 一 《aisx2 基 声 维 随机 疝 量 , 共 中 子 应 是 2 是 > 维 的 ， 
x， 是 上 一 + 维 的 ，x 的 分 布 函数 为 F(x)，xt 和 za 的 边 绿 分 
布防 数 分 别 为 FX) 和 F(x12。 
定义 1.3 如果 
PX) = Px) Fxs) 《1.107 
则 称 2 和 x 是 相互 独立 的 ， 
考 x 是 连续 型 的 ，x 的 分 布 密度 为 f(x)，x， 和 xa 的 边 
缘分 布 密度 为 户 (x 和 jCxi)， 那 么 (1.10) 等 价 于 


» 


Hex) = lx} 。 fCx2) | C1.11) 
若 x 是 离散 型 的 ， 记 e 一 【ef 的 了， = af, ol) 
入 一 《af 外， 那么 x 的 概率 分 布 与 x,、x， 的 边缘 格 
率 分 布 当 且 仅 当 有 尖 系 式 
Plx= a) = P(x= a): Px, = aq) (1.12) 
时 x， 和 x， 是 相互 独立 的 。 
定义 414 设 闻 一 (xx2 xy 是 一 问 维 随机 向 量 ， 其 


中 


中 xz; 是 9 维 向 量 , 晶 > 9 一 pp， 设 x 的 分 布 范 数 为 F(x)， 


[EE 


2 的 边 绿 分 布 函数 为 Fx) (i 一 1- 一, 和 要 )。， 如 果 
F(x) — TI PKzn) C1.13) 


则 称 xi,-… ,x。 是 相互 独立 的 。 

当 x 都 是 一 维 详 数 时 ,我 们 称 x 的 诸 分 量 #*,…*,*。 是 相 
互 独立 的 . 

当 x 是 连续 型 时 ,(1.13) 等 价 于 


Kx 一 I fr) (1.14) 


其 中 fx》 和 Hz 分 别 是 x 的 分 布 密度 和 x; 的 边 绿 密度 ， 
当 x 是 离散 型 时 ,如 同 (1.12) 可 以 给 出 (1.13) 的 等 价 条 件 . 
如 果 将 x 划分 为 子 容量 Xx."X。s 见 x ~ 《xi,，* xn) ,人 尾 
音 二 个 子 铅 是 zx; 和 xi 相互 独立 ， 则 称 x1，-- x。 是 两 两 独立 
的 ， 
注意 如 果 x,,*…',x。 是 相互 独立 的 ,它们 必定 两 两 独立 ， 肥 
之 则 未 必 成 立 。 
定理 1.2 车 2 维 随 宙 向 量 x 一 (xi, -xw)》 其 中 x; 的 维 


《zs 严格 说 : 《1,112 式 在 R? 上 几 平 站 处 成 立 。 以 后 如 有 类 做 的 地 方 哉 不 再 一 
一 培 明 ， | 


上 


数 为 fis > gp, 则 次 1 “9 相互 独立 的 充分 必要 条 性 
[| 


是 ; 
对 于 x; 导 环 中 的 性 疙 集合 引 上 二 一 1, 加) 起 立 等 式 


P(x€E 奋 XeE Ba) ™— I Plxs € B;) (C1.1%) 


定理 1.3 若 p 维 随机 向 量 x 一 《xi Xn》， 其 中 xi 的 


维 数 为 4 ，> 1 一 P， 则 x1,…xm 相互 独立 的 充分 必要 条 件 是 : 


对 于 x 的 任意 4 维 可 测 函 数 gxi) CG 二 1)， 
SX Sexzm) 是 相互 独立 的 ， 
上 述 二 定理 的 证 明 可 参考 [35]. 
《三 ) 多 元 随机 向 量 的 数字 特征 和 特征 函数 
设 一 人 xxz?) 是 疡 维 随机 向 是，2 一 《zf 是 x 
阶 随机 年 阵 . 
定义 1.5 车? 绎 随机 向 量 x 的 每 个 分 量 % 都 有 数学 期 望 
《均值 》 Ex; 存在 , 则 . 
= Ex = (CEX, .Er,) C1.16) 
为 x 的 数学 期 望 向 量 4 均 值 向 量 )。 
而 厂 机 禾 阵 Z 一 《siipxy 的 数学 期 望 拖 阵 同 祥 可 定义 为 
EZ ~ CEgi;)pxs C1.17) 
定义 1.6 . 若 ? 维 随 机 疝 量 x 的 各 分 量 x 存在 二 价 宕 , 共 中 
的 方差 为 . 
Vartxi) = ECxi— EXP — TA i= 1 Pp), 
#i 与 x 的 协 方 差 为 
COvri sx) 一 ECX — Er}xri — EX)Ao) 
(Bi = 1 sp), 
则 称 芒 wm 诸 元 素 组 成 的 Px P 叭 无 阵 


* SF 


Ty DT "+* Oip 


F=|% | 王 (on) = ECx — Ex)(x — Exy 


Tp 加 oz Opp 
《1.18) 
为 x 的 ( 自 ) 协 方差 矩阵 , 简 记 为 cov(x) 一 了 2. 

若 维 随机 向 量 x 一 (#4，:…*，xp》 和 2 给 随 机 向 量 y 一 
Cy Yq》 之 间 请 分 重 x 和 入 之 间 协 方 着 vi; 一 covCw,s ji) . 
存在 C 一 1 人, 记 了 一 1 2920， 则 称 以 vi 为 元 素 的 PX 
阶 和 矩阵 


Vo tv) ™— E(xX— EXCyY — EyY 
为 x 和 y 的 协 方差 簿 阵 , 简 记 为 covtx,y) 一 下 。 
关于 术 期 望 初 协 方差 运算 有 下 列 定 捍 ， 
定理 1.4 设 x,y,u,0 为 了 维 取 机 向 量 , Z 是 了 x 2 阶 蝴 机 
矩阵 ，4，8B ,CD 是 适当 的 常数 垂 阵 ，a 臣 # 维 常数 向 量 ,那么 
下 列 等 式 成 立 : 
TI》 EC(Ax + By) ~ AExX + HEy; 
2) covlx + oa) — cov(x); 
3) covCAx,By) 一 Acov(x,y)B’; 
4) ECAZB-H- CI= A EZ»B++C; 
5) E(trAZ) = irtA. EZ); 
6) coviAx) 一 Acov(x yd’; 
TD) covtAx 十 By, Cut Do = Acov(x, uC 
+ Acovix oD 十 Bcovfy su)C 十 Beovty oD 
证 明 企 此 仅 证 明 3) 式 ,法 祭 留 给 读者 证 明 . 
covCAx, By) = ElAx ~ EC(Ax)][By — ECBYY) 
-= EltA(x — Ex){y — Ey)* 8B'! 
= AE(x — Ex)(y— Ey)B’ 
w= AcOvIXLy)B, [| 


» Sp. 


为 了 了 解 缚 给 | 这 机 向 蜗 一 (1 下 各 分 晤 和 入 
之 间 的 相关 关系 , 异 义 x 和 各 的 相关 系数 为 
COVCX, , Ki) oi 
LvarCx var Cx) Moo 
Co Di 的。 {L119) 
以 op 为 元 素 的 PX 了 阶 算 际 pe 一 《pi 称 鸭 x 的 相关 系 
数 算 隆 { 相 关 和 矩阵 ). 
显然 pr 一 1G 一 1 若 记 Ds 一 diaglass 290pp)s 
相关 系数 矩阵 可 由 下 式 求 得 - 
oe— DE. 3. Dz C1.20) 
由 于 ZZ 是 非 负 定 和 给 阵 ,从 而 ?是 对 角 元 素 为 ! 的 非 负 定 第 阵 。 
对 于 畏 机 甜 隆 Z ， 利 用 vecZ ， 刚 可 求 得 Z 的 诸 分 量 的 协 方 
差 矩 阵 和 相关 系数 扎 阵 . 
xs 和 *; 的 相关 系数 pf 具有 下 烈性 质 ( 参 著 [1]7: 
1 0 soil 安 1; 
2) 当 soi 相互 独立 了 时，pij 一 0; 
3) |1eii 一 1 的 充分 必 训 条 件 是 存在 常数 a; 地 0 和 名 使 得 
Plrio= Gt 二 b}= 1; 
4》 对 -十 任意 常数 机， 下， 页 ， 页 ， 设 和 一 本 十 让， 入 一 
引 扩 十 碳 ， 那 么 六 和 六 的 相关 系数 of?y7) 满足 
Pi dg 0 
pfyayy2) 一 《一 pi digi < 
0 aa= 0 


若 os 一 0， 则 称 x 和 x; 是 不 相关 的 . 
设 g(x) 是 ? 维 随机 向 量 x 的 可 测 函 数 , 且 x 的 分 布 函数 
为 F(x)， 则 gCx》 的 数学 期 望 定义 为 


Eslx) ~ | ,Cx)aF lx). 


PIs Ti) 一 Pi 一 


.5 


此 
特殊 地 , 当 g(x) 一] xi， 于 入 Eslx)》 称 为 x 分 量 的 联 
i=1 
合 知 ， 菩 上 如一， 工 述 Eg(x)》 称 为 x 的 万 阶 联合 矩 . 


定理 1.5 设 2 维 有 晨 岂 向量 x 名 分 量 的 二 阶 知 存在 ; 4 是 ?了 x 
如 阶 管 数 对 称 抵 阵 ， 五 x 一 上，covCXx) 一 三， 那么 
1) Exx’ 一 三 十 本 《1217 
2) E(x’ Ax) = trAF + pAp (1.22) 
证 明 1) Exx = El(x #8)+ ullx p+ 
— Etx — ENMx— HY + Ex— pH) 
‘+p ECx— p+tpe:m 
m 呈 了 十 pH"* FY 
2) Ex'Ax = ElCtrAdxx) = trACF + EA) 
= tA ta Ap, 
定理 1.6 如 果 ? 维 | 绑 机 向 量 x 一 (xt, x;》， 其 + 维 子 向 层 
Xx， 和 PP 一 + 维 子 向 量 x 相互 独立 ，&4.(x,) 是 x， 的 可 漠 丙 数 ， 
gxX;) 是 x 的 可 测 函 数 , 则 有 
Elg(x)* g(x) — Eg lx) * Eglx2) (1.23) 
证 明 设 x 的 分 布 晴 数 为 F(x),x， 和 x， 的 边 绿 分 布 泣 数 
为 FXX) 和 FAX2)， 由 x 和 x; 相互 独 立 知 FCX) 一 PLX 
FXi) 所 以 


Belx ez) 一 | , gx gx)aP (x) 


一 | r SXIAF LX) | pr SX A PAK) 
只 RR 


一 Eg(x) * Eg xX), 
推论 1.1 若 随机 向 量 i 《2 py 诺 分 量 相 互 狂 立 ， 
g(x) 是 上 的 可 测 孙 数 ,那么 


E a es)] 一 下 EgCr) 
lel dt 


» 6 ， 


俯 一 般 数理 统计 中 我 们 已 经 知道 特征 奖 数 在 理论 推导 、 尤 其 
在 极限 理论 中 起 了 重要 作用 ， 这 里 我 们 介绍 一 些 多 元 随机 向 量 的 
特征 函数 的 定义 及 其 性 质 , 这 些 性 质 的 证 明 可 参考 [2]， 

定义 17 设 ? 维 随机 向 置 x 一 (x,,'*':,xs) 具有 分 布 函数 
FX), t= (pt) 是 任 一 了 维 实数 向 量 ，x 的 特征 函数 定 
多 为 


去 生生 
gs 一 已 et Fe Tl a (peaFC) C1.24} 
多 元 特征 函数 px(t》 具有 下 列 性 质 ( 类 似 于 一 元 情况 ) 
1) gstf) 在 Rr* 中 一 致 连续 ， 且 19Ct] < px 的 一 1， 


Pe 一 和 一 xit)， 其 中 gxCt) 是 px)y 的 共 轿 函数 ， 
2) 设 4 是 1 Xx 了 阶 常 数 征 阵 , 6 是 + 维 常数 向 量 ， 那么 入 一 
Ax 十 了 的 特征 范 数 为 
py) eh, pl AE). (1.25) 
3) 《边缘 分 布 的 特征 函数 ) 设 x 一 (xi,Xxi)，x， 是 ” 维 子 向 
* 的 特征 函数 为 pxkt，x， 的 特征 函数 为 px (ty， 那 末 
put 一 per 00 ,0) 
即 在 xfKE)》 中 令 pH 一 一 有 一 0 


4) 若 > 的 大 阶 联合 短 E(xh…s 各 ) 存在 , (一 本， 


册 
ECch ae) 一 《一 5 全 ea to | . 
? zj 
(1.26) 
9) 设 x 一 《xiX2)， 且 x, 与 x 相互 独立 ，px(1), pz (8)， 
exif fa) 分 别 表示 Ls 相应 的 特征 瑟 数 ,其 中 t= CB, 惠 
和 : 
下 xf 一 名 ” Tatty {1.272 


+ 有 


反之, 若 (1.27) 式 成 立 , 则 x， 和 六 相互 独立 . 

6) 设 丙 个 志 维 随机 向 量 x 和 yy 相互 独立 则 zs 二 x 十 3 
的 特征 函数 pt》 满足 

Pe) 一 pet) " pf), 

其 中 xf， FE 分 别 是 x 和 y 的 特征 函数 。 

7) 设 二 一 (tp 的 特征 函数 为 re 其 分 量 x 
的 特征 函数 为 psi(a)， 则 x 的 诺 分 请 2 zy 相互 独立 的 
充分 必要 条 件 为 


二 
pt Ee 名 “= 工 Ee = I eww. 


8) 《逆转 公式 》 设 x 一 (xi,-…*，wy)》 特征 函数 为 po 
它 的 分 布 荡 数 为 FCx) 而 了 wy 一 {Ce :, DSS Dis . 
G4 < bs 一 1,……*,P} 为 了 维 立 方 体 , 则 
Plr€1iat)— lim Can) 全 人 HH 


Ee py 一 全 大 局 


Pi 
. i Palf,s *™ ~ tp) ds,- ™ "dip 
是 


这 里 ais5 取 法 要 求 x 在 fiws) 的 各 个 面 上 概率 为 0。 

9) 《唯一 性 定理 ) 随机 向 量 的 分 布 通 数 由 它 的 特征 承 数 唯 
一 决定 。 即 两 个 随机 向 量 的 分 布 函 数 恒 等 的 充分 必要 条 件 基 它们 
的 特征 函数 恒 等 。 

”10) (连续 性 定理 ) 设 {fF;(x)]} 是 一 申 分 布 函 数列 ,和 p;(t)} 
企 相 应 的 特征 函数 烈 ， 则 F(x)》 按 分 布 由 敦 Y 于 -一 个 分 布 函数 
FCx》 的 充分 必要 条 件 是 中 it) 收 化 到 一 个 在 一 0 处 连续 的 
函数 p(t)， 这 时 F(x) 相应 的 特征 荡 数 就 是 p(t)， 


Cw) 如果 在 FLX) 的 连续 点 处 者 有 1im Prtx) 一 下 (xz)。 刚 称 下 wx) 接 分 布 收 委 
EE 


* 2 


例 1.5 设 这 一 《2 “ ) ~ PC 名 Pr) 求 这 
的 特征 函数 。 


EL te rp} 


3 nn!} ¢ pr reper 


mm RE rt! 


= pct pe oe ot pre eh Pi)’, 
上 式 当 一 一 一 0 时 正 是 二 项 分 布 有 as pp》 的 特征 限 
数 。 


例 146 设 关 一 fox 具有 例 (1.2) 中 的 密度 ， 求 它 的 特征 
函数 和 -二 阶 矩 。 
解 wn 1) 一 | | CHIietttasa etn dy, dx 


1 
Gn 1) {inom i) 


Ex, = 《一 站 也 pln 9 六) | Cy 
Ds, 


= 一 人 一 1 C8 一 1 ,mp —1, 

闻 理 有 Ex 一 1, 
By r, = CA 0 
2 Dr Or 


2 


Plt sh) | er 1， 


Exi™ (CC—0 过 Pa sh ge ey 一 2, 
Bn 
所 以 


Ex 一 2 一 (小 z=- co 一 人 (， ,) (0 ) a 1) 


在 文献 [11，[21 中 都 浊 及 随机 向 量 及 随机 向 量 的 函数 的 变换 
= 3+* 


到 分 布 , 在 末 眉 我 们 将 其 主要 舌 果 归纳 一 下 ,并 且 仅 对 连续 型 分 布 
写 出 其 结论 . 

若 x 一 《x ，zxp)》” 的 密度 为 x), yy 一 人 ye 
Cm 安 名 ， 其 中 9 一 Cx》 是 x 的 可 测 商 数 ， 希 望 求 出 w 难 随 
机 向 时 ? 的 分 布 . 

设 F,(¥) 是 y 的 分 布 函数 , 则 

FA) — PIgCX) Ye BC) yn) — PlxE BY 
其 中 B= we esxp), gts xp) yi i 1 ms 
从 而 


BC 一 | Kxz)dx (1.28) 
Ee 
当 于 一 1 时 就 得 到 8 维 随 机 向 盟 x 的 一 维 函 数 的 分 布 。 
定理 1.7 设 » 维 随 机 | 问 量 省 一 《sz 的 密度 为 Hx), 
击 了 一 {Ns yy ™ a(x) 一 (g(x), "ss EpCX)Y 是 从 向 
量 x 到 >》 的 一 对 一 变换 ,并 设 存在 唯一 的 到 函数 x 一 名 y) 一 


CHOY "shy)), 它 有 一 阶 连续 偏 导 数 FG 了 一 1 Pp), 


其 变换 的 Jacobian 行列 式 为 二 | ， 则 ?的 分 
ty) 1+ 
布 密度 为 
APD) JCx 一 y) y EECx) 的 什 域 G 
fF) 一 { 其 他 (C1.29) 


证 明 当 yeetx)》 的 值 城 G, 显然 Cy) 一 0, 当 yeEC 了 时 
由 (1.28) 知 ，y 的 分 布 函 数 为 


PFC) 一 | | fax 


Eg: 
条 用量 积分 的 变量 替换 公式 知 
PCD 一 | 人 KI > ydy 


» 相生 


由 密度 函数 定义 知 y 的 密度 为 
f(y) — hy :xy) yEG. 是 

注意 ,i 着 yy 的 维 数 记 低 于 x 的 绯 数 py, 则 窝 求 y》 的 密度 
可 先 作 变换 多 一 (rat Xp》， 即 也 的 前 mW 个 分 量 为 了 ,局 
一 各个 委 量 为 xz， 专攻 定理 1.7 求 出 多 的 分 布 密 度 ， 
然后 再 求 多 的 子 向 量 ”的 边缘 分 布 密度 。 

i 若 y 一 g(x) 的 反 责 数 不 喉 一 ,而 有 站 组 赣 变 换 。 

人 = kNCy), f= 1， = 

此 时 y 取 每 组 值 Cy,,-…:,y,) 将 对 应 于 巨 组 x 中 下 (x 
x 中 ,因而 y 取 G 中 茶 区 域 的 概率 为 x 取 值 于 个 相应 集合 
率 之 和 ,于 是 每 组 y 与 x 《它们 是 一 一 对 应 的 ) 可 用 定 于 1.7 求 
出 它 的 密度 ,然后 相 加 丽 得 到 y 的 密度 , 即 . 


P57), Cx -ry) yE gtx) 的 值 域 G 
0 其 他 

其 中 jtx 一 y) 是 第 ;组 道 庆 换 的 Jacobian 行列 式 ， 

§2.2 多 元 正 杰 分布 


普 先 同 顾 一 下 一 元 正 态 分布 ， 设 #* ~ NO) (一 吕 之 
站 < 妇 二 co 如一 0) 即 指 随 机 变数 * 具有 密度 


fx) 一 5 op 人 一 * 寺 (2.1) 


区 y= 


它 的 特征 函数 为 
PO 一 exp {i 一 土 on (C2.2) 


如 果 邻 ， 一 一人， 那么 了 ~ AMK0，1)7《〈《 称 了 服从 标准 正 态 分 


布 ) 此 时 则 有 * 一 挟 十 oy 的 关系 式 成 立 。 
帮 为 一 元 情况 的 推广 ,我 们 给 出 多 元 正 态 分 布 的 定义 ， 


= 


定义 2,1 (p 维 正 坊 分 布 的 古典 定义 》 如 果 8 维 随 机 向 量 
一 《x ,+ XxX》 具有 下 列 分 布 密度 


fx) ~ (2r)- 引 texp | 一 于 人 x 一 22 一 p)) 


(2.3) 
其 中 pp 是 上 2 维 常数 疝 量 , 是 捐 阶 正定 算 降 。 则 称 x 服从 了 元 
正 楚 分 布 ; 记 为 x ~ N,(p,2). 

下 面 验证 所 x) 确 是 一 分 布 密度 。 
由 于 了 六 0，|3| 之 0， 所 以 人 x) > 0 只 贫 证 朋 


i— 人 Kx)Mdx = 1, 


作 恋 换 省 Eiy 十 #iy 其 中 一 CY ~™y yp 了， 由 第 一 章 
推论 4.1 有 /x 一 y) 一 12814 一 [3 此 时 (x 一 p51(x 一 
pH) 一 y，y， 得 到 


5 oo Pp - 
1 一 | meeep (4 DA) ayy 
sd 一 EE 
Fs» 
” 1 1 
— 一 一 一. — — yir dy: = 1 
于 到 oo 2 ” 


即 藉 x) 确实 是 一 个 ?了 维 分 布 密度 ， __ 
从 上 面 推导 中 看 到 y 一 〈》。…-，?8)》 有 密度 〈2r)-#erp ， 
{一 二 yy] 即 > ~ Nr(9，15， 它 的 各 个 分 量 服从 NC0,1) 且 


了 
A 


相互 独立 ,我 们 称 y 是 了 元 标准 正 态 向 量 ,由 此 可 知 
Ey— 0, cov(y)— 1,, 
对 于 随机 向 量 x ~ Np(pj，Z)， 它 可 写成 * 一 Hy 十 下， 其 中 
~ 和 Net0,1,)， 于 是 
五 这 一 pH, coOvCxX) 一 BE tovCy)* ZE 一 3, 
由 此 可 网 了 稚 正 访 分 布 完 全 由 它 的 期 望 向 量 pg 和 协 方 差 入 和 阵 3 
决定 . 


.和 


下 面 求 x 的 特征 了 苹 息 。 
褒 EE ti ” “py 是 任意 如 维 实 名 让 ， 法 特征 阴 数 访 
Pat} = Ecxptlif' x) — Eecxplit (23y 十 p)] 


| 外 
Plt) 一 explit' pn) + Fexplia'y) =— explit' pp). {I Eexplia,y.Y 


， 1 < 
exp{it a) 。 exp (一 3 之 9) 
一 ex 和 一 ec 一 exp itn ~— lr 
"| ee 2 | be rt). 
由 特征 性 质 的 玲 一 性 ,我 们 也 能 如 下 定义 了 元 正 态 分 布 。 
定 兴 2.2 如 果 靖 维 随机 向 量 x 有 特征 函数 
Prt) 一 exp dr 一 = £34} 


[9 


其 中 pe 是 维 常 数 向 量 , 是 了 阶 非 负 定 和 矩阵 ， 则 称 x 服从， 
元 正 态 分 布 Np(p,3)， 

注意 到 在 定义 2.2 中 只 要 求 卫 非 负 定 , 显 然 当 三 正 定时 , 它 与 
定义 21 等 价 。 而 涛 13 引 一 0 时 , 设 rk3) 一 rr<pP， 可 以 证 明 
x 的 分 布 概率 为 1 集中 于 Rr? 的 一 个 > 维 子 空间 上 , 从 而 无 法 给 
出 《2.3) 的 密度 有 形式, 我们 称 之 为 退化 (或 奋 异 ) 的 正 恋 分 布 。 今后 
在 理 沦 探讨 中 经 常 使 用 定义 2.2, 因 为 它 包含 了 非 退 化 和 如 化 的 两 
种 情况 . 

下 看 定理 指出 了 多 元 正 态 分 布 与 一 元 正 态 分 布 之 闻 的 密切 联 


系 


定理 2.1 ? 维 随机 | 向 量 x ~ NoCp, >) 的 充分 必要 条 御 是 
对 于 尾 意 了 维 常数 庙 量 qa， 线性 组 合 yy 一 wx 服从 一 元 正 态 分 
布 Ntan,a Ta). 

证 盟 ”由 于 x ~ NCp, 人 3)， 它 的 特征 函数 为 


s 


exp itp 一 四 ezt 
从 而 了 一 ax 的 特征 畏 狼 为 
ty = Elcxpiry) — Eexpli(rayx] 
一 exp | 《aa 一 立 raza)] 
与 (2.2) 比 较 , 它 正 是 NCa'p,a'3a》 的 特征 配 数 ,由 特征 冰 数 叭 一 
性 知 y~ Niapsa Ze), 当 23a 一 0 时 ,有 PC 一 GD 一目 


则 ?可 看 成 是 服从 退化 正 态 分 布 NCa'p,0). 
庶 之 ,车 对 任意 维 常 数 向 奶 ay 一 下 三 人 Nl(ap,a Bo) 于 


是 的 特征 陨 数 为 再 人 FE2 一 exp | ea 一 请 ra'zal| 


它 也 可 看 成 
Eexpli(ra}Yx] = exp | 《re 了 Ra 一 = Cra)'zCra|- 


令 + 一 1， 由 于 a 是 任意 ? 维 向 量 ，Eexp(ia'x) 正巧 x 的 将 
征 隧 数 


pata) 一 exp [er 一 二 a'sal 


由 定义 1.2 知 x~ NCp, 2), 

由 定理 2.1 我 们 又 可 给 出 了 乡 元 正 态 分 布 的 另 一 等 价 宝 义 - 

定义 2.3 ”如 果 P 维 随机 向 量 x 的 尾 一 线性 组 合 wx 服从 一 
元 正 态 分 布 N(a'p,a'5a)( 包 括 退 化 的 正 态 分 布 ); 则 我 们 称 x 服 
从 了 元 正 态 分 布 N,(p, 3)， 

定义 2.3 的 优点 在 于 把 一 个 多 元 正 恋 分 布 的 问题 化 为 等 价 的 
一 元 正 术 分 布 问题 进行 讨论 ， 从 而 可 推出 多 元 正 态 合 布 的 许多 性 
质 与 一 元 时 相同 . 

下 面 将 给 出 多 元 正 态 分 布 在 线 姓 变换 下 的 不 变性 ， 并 讨论 它 
的 子 商 量 的 边缘 分 布 以 及 根 互 的 狂 立 狂 。 最 后 给 由 独立 性 和 正 态 


a DB" 


性 之 间 的 关系 。 
定理 2.2 设 xz~Nifay za。 那么 对 性 一 + X 了 阶 常数 短 
阵 只 及 任 一 7 维 常数 向 量 a 有 
Dx a~ NDept a,D'2D) 
证 明 设 蚌 任 一 + 维 向 景 , 令 &8 一 Dt, 那么 Dx 中 a 的 
特征 函数 是 
Elexpit' CDx 十 a)] 一 exp(lit'a) Etlerxpib’'x] 


一 exp(if'a}: exp( Bp 一 立 b'55) 


一 exp it CDp 十 ay) 一 于 eCpzp')d| 


从 和 而 Dx + a~ NDp + a, DED'). 
推论 2.1 令 着 (x1 X2) ~ Notp ,2), 其 中 


， Du 2 
nT 人 一 Cs 下 
FH 与 下 各 全 维 子 向 量 ,，, 是 + X + 阶 ,那么 
x ~ NR Zn. 
证 明 ”只 须 在 定理 2.2 中 取 DD 一 Ci,0 ,xp 即 可 。 和 
由 于 x, 的 选取 是 任意 的 , 旦 xi 位置 舍 许 交 换 , 从 而 有 下 列 定 


理 ， 


定理 2.3 设 x ~ Nlp;3), 则 x 的 性 一 闻 向 量 也 是 正 态 分 
布 的 , 它 的 期 望 向 度 等 于 的 相应 子 向 量 , 而 协 方差 年 阵 等 于 允 相 
应 的 子 伟 阵 . 

若 记 一 Cp ypp) 2 一 《on)pxps 则 x 的 第 i 个 分 量 
zi ~ N(pis Gin), 

注意 到 定理 2.3 的 逆 定 理 并 不 成 并; 即 尽 管 每 个 分 量 的 边 绿 分 
布 是 正 态 分 布 , 但 x 二 (%*%,， ,Wp》 的 联合 分 布 并 不 一 定 是 正 态 
分 布 的 ， 

例如 ,二 维 随 机 向 羽 x 一 (x,,*%)》 有 密度 


+ 59 = 


下 x) ot2r 1 —p’ Pepe oy (xi 一 2px,x, 十 5 


+ (li— llr vl 


+ expd- (4 — 29%. 十 9 C2.4) 


一 1 
1 HY) 
其 中 0<z< 和 ln0<lol<t0<|l<1，o 关 吕 
容易 验证 #5 和 的 过 缘 分 布 是 正 态 的 ， 但 (2.4) 却 不 是 正 态 分 布 的 
定理 2.4 所 维 随机 商量 x ~ Ntp,2)(Z 是 了 辽 非 负 定 阵 ， 
且 rkC2) 一 7) 的 充分 必要 条 件 是 存在 黎 为 * 的 >XPp 和 价 算 阵 
8B8, 佳 得 BB 一 了 且 有 x 一 By 十 &， 共 中 yy ~ NN(9,1,), 
证 明 ”充分 性 让 定理 2.2 立即 可 得 。 
轴 在 设 一 和 ,Cp;3)， 且 rk(F) 一 + 刀 训 由 于 卫 非 任 定 ， 
由 第 一 章 定理 3.1 知 存 在 正 交 阵 P 使 得 
P32P’' 一 人 ” 
0 0 . 
其 中 4 一 出 agfl sr) 是 由 2 的 非 零 特征 根 i 之 0 和 梅 成 的 
7 阶 对 前 阵 。 令 
4 过 
p=- (0 1) 


pr 
显然 也 非 奇异 ,于 是 了 一 DP 也 非 坷 异 且 成 立 

FS3F’ (7 - 

. 0 0 

令 yy 一 Cy1583) 一 Fx 一 HR)， 其 中 y, 是 7 维 向 医 ， 为 

了 一 r 维 向 量 , 由 定理 2.2 知 了 是 正 态 分 布 , 且 Ey 一 0,covCy,) 一 
1 cov(y2) 一 0， 及 而 PCy; 一 们 一 | 成立 和 而 yy ~ N00,1,) 
记 F711 一 《B83,G)}， 共 中 8 是 上 Xr 阶 知 陈 .于 是 


x—p—= Fiy=(B,G) (©) 一 By, 
- 3 


a 7 


琵 尘 为 ] 成 立 , 即 x 一 By 十 KE， 此 外 
fi 0 -IN i, 0 BN\ _ a pn’ 
FF (， 1 CE) (8,G)(， cr) BB 
从 而 定理 得 证 。 国 
定理 2.4 一 方面 刻 划 了 才 异 正 态 分 布 与 非 奇异 正 态 分 布 之 图 


的 联系 ， 另 一 方面 也 给 出 了 袁 元 正 态 分 布 的 另 一 个 等 价 定义 。 
定 兴 24 若 f 维 随机 向 量 x 可 以 表示 为 


X= by 
其 中 了 起 7 维 随 机 向 星 甩 y ~ NA0,1.)。B 是 牧 为 ?的 了 fxr 


阶 先 阵 ， 起? 了 维 常 数 向 最 , 令 二 BB'， 则 称 x 服从 ?了 元 正 
态 分 布 Nk:5)， 称 + 是 这 个 分 布 的 秩 ， 
定理 25 设 x~ 入 ,CpE,2)， 并 将 x 划分 成 xx 二 (xiy X27" 
对 pp 和 3 作 相应 的 划分 
上 大， Zh Zu 
PT (人 一 (5 2 
则 x, 与 x; 相互 独立 的 充分 必要 条 件 是 5,, 一 0， 
证 明 ”由 于 相互 独立 保证 协 方 差 为 0, 必要 性 是 显然 的 . 
车 B21 一 0， 设 一 (i,f》 为 尾 一 了 P 维 向 量 , 其 中 蚀 是 7 
维 的 。 于 是 
7 pt) = Eexplit'xy 


一 ep iCt, 8) (0) 一 二 (全 (0 二 @ 站 


一 exp itip, 一 二 53) . 


上 


ps 1 
+ exp it 一 可 Et 


一 Elcxptitx)] * Elexpiitsx)] 
一 ped) polta), 
站 ”i 站 


注意 ， 它们 的 让 下 外 
立 第 ,例如 在 密度 (2.4) 中 令 “一 > 二 ?一 一 8， 可 验证 cov(%,， 


5) 一 0, 但 它们 并 不 独立 ， 

推论 2.2 设 x ~NA0f). y= Ax-- pu, Zz— Bx+y 
其 汕 4 是 w Xe 阶 征 阵 , 下 是 说 X p 阶 矩阵 ，R 是 # 维 向 量 ,» 是 
纪 淮 则 量 , 那 么 ? 和 相互 独立 的 充分 必要 条 件 是 48' 一 0 


证 明 令 
“一 (= 


Ad' AB’ 

~ Nate (3 38 外 
由 定理 2.5 知道 y 与 z 相互 独立 的 充分 必要 条 件 正 是 -48' 一 
0。 用 

ee 设 x~ Np, EB), y— Ax+e, zs™" Bx+d 
则 > 和 z 相互 独立 的 充分 必要 条 和 件 是 4EB 一 0。 

证 明 ” 按 定义 《2.4) 知 存在 7 维 随机 向 其 加 ~ N.C(0，1,)， 
《r 一 rk(2)) 使 得 x 一 Dw 二 pp 且 DP’ 一 3. 
从 而 有 

y=— ADw (Ap+e), T= BDw+ (Bnd) 

由 推 论 2.2 知道 y,z 祖 互 独立 的 充分 必要 条 件 是 


由 定理 2.2 知 


(CAPDYCBDY 一 ADD'B’ 一 43EB ~ 0. | 

推论 24 设 x ~ Na:E)， 且 它们 的 分 据 形 式 为 
四 ft, 3, -2 
zx 一 下 一 六 卫 一 | : | 
x ps | 


则 x ,x 让 互 独立 的 施 分 必要 条 件 是 2 的 非 对 角 块 Bi 一 
+* Fs 


人 = 了 一 1 2， 。 隐 至 一 ia 区 《三 
英 手 多 元 正 态 分 布 的 可 如 性 有 旭 下 定理 : 
定理 2.6 设 Xr ™ 1 ， K) 相互 独立 十 XA. ~ NeCa,, 
2,), 还 各 对 于 已 知 的 六 关 瑚 阶 乞 阵 4,(r 一 1,+ ,RR), 有 


上 

2 一 之 Axr ~ Ns (> A > 4D) 

证 骨 ”考虑 特征 没 数 - 
Pt) = Ecxp [i# (> 4x,) 


* 

= ll BCexpit Ax.) 
， 

一 1 op( i Ap 一 可 FCAEA)s) 
rset 


不 上 
一 emp 人 性 > Ap 一 ie(D 54) 
r=1 了 一 人 


于 是 由 特征 函数 唯一 性 即 可 推出 结论 。 虹 
推论 2.5 如果 x,Cr 二 1-…, 丰 ) 相互 独立 且 服 从 同一 分 布 
NE )， 那 么 样本 均值 | | 


于 一 元 > Xp, ~ Ne(p， 天 5). 


证 明 ”只 须 在 定理 2.6 中 取 mw 一 p，。 4 一 Er (Cr 一 1 


) 即 可 ， 

关于 随机 向 量 的 正 态 狂 和 独立 人 性 育 一 定 的 关系 ， 下 面 两 个 定 
理 给 出 了 这 方面 的 一 些 结果 ， 

定理 27 设 x 和 y 是 两 个 相互 独立 的 ? 维 随机 向 量 ， 则 
xy 服从 正 态 分 布 的 充分 必要 条 件 是 x 十 ? 服从 正 态 分 布 。 

证 明 ”必要 性 由 定理 2.6 中 令 下 一 2， 如 一 有 一 大 立即 可 


看 太阳 


对 于 充分 铂 尖 了 一 1 了 时 Cramer 釉 给 出 了 证 明 , 其 谚 明 涉及 
其 他 知识 内 容 ， 我 们 个 再 证 中， 我 们 将 作用 了 一 1 的 结论 和 定 浆 
2.3 证 组 了 之 1 的 结 玉 。 设 X,Y 独立 是 2 x 十 y 服从 正 态 分 布 。 
令 # 一 gx， vv 一 qa'y 《其 中 a 是 任意 非 零 向 量 )， 则 由 定理 21 
知道 # 十 ” 服从 一 维 正 态 分 布 ， 巨 由 定理 13 知道 & 和 vw 仍 保持 
独立 ,由 乡 一 工 的 结论 知道 w，” 服从 正 态 分 布 ,由 & 的 任意 性 ， 
接 定 义 2.3 知 x,y 服从 正 态 分 布 ， 晶 

定理 2.8 设 XxX 是 相互 独立 的 靖 维 随 机 向 重组， 记 


3 一 5 dXiy 也 二 > bXis 
其 中 qs bi 一 ti， 人) 是 两 组 实数 , 则 有 


D 着 xi(i 一 1 aa)》 服 从 相同 的 正太 分布, 且 ob 一 


0， 则 y，z 相互 独立 ， 

2) 车 y,z 相互 独立 , 则 每 个 使 得 a;&; 0 的 相应 的 x 服 
从 了 维 正 坊 分 布 . 

关于 定理 的 1) 的 证 明 是 容 狐 的 ，2 的 证 明 可 参考 [415]。 

最 后 我 们 给 出 一 个 二 维 正 态 分 布 的 例子 。 

例 21 设 p 一 2， 


(ey) 


1 当 lp| 之 1 时 ， 
(7 “2 满足 
. pid mm 
[了 = (1 ooioi, E>0, H. 
1 of 一 2crici 
一 让 一 PT1ri 1 pF ) 


3 一 


+ PA 


x 的 密 意 为 


Hx,, = Ce pa 


1 
2z0 ,0 {~ rrp oi 
一 2pC%, 一 pz — p12) 十 {xz 一 | 
TO 傈 2 

而 ”% 的 边 绿 分 布 为 WCaiyro 人 ， 鸭 边缘 分 布 沟 NGCrasoi，P 是 
% 和 x 的 相关 系数 ,显然 当 且 仅 当 6 一 0 时 

x xX) = fCx fCr) 
(其 中 f(y》 和 (加) 正 是 ,和 的 边缘 分 布 密度 ) 即 *%， x 相 
豆 独 立 。 

2 当 |p| 一 1 时 ， 

比 时 || 一 6， 可 推出 x% 和 之 间 以 概率 1 存在 善 线性 
关系 。 这 十 让 于 了 非 满 佚 ,存在 非 零 向量 上 一 (55 使 得 到 一 
0， 由 2t 一 0 推 得 E[# Gx 一 了 一 0， 另外 又 因为 ELt'Cx 一 
Fj 一 0, 所 以 
0 以 概率 为 1 成 
立 ， 

反之 , 若 yz 以 概率 1 存在 线性 关系 ， 不 妨 设 x 一 sx 十 
ba 地 03， 拖 么 


coOv(xs Tt2) _ Avartx) 
PT [CvarCxz TY arCxD2 lalvarCx,) 
{ 1 站 站 
-一 | a < 
即 1o| 一 1， 


当 p > 1 时 我 们 克 +， 和 x, 存在 正 相交， pe 0 时 称 *， I 
x 存在 贷 相 关 ， 
为 了 对 多 维 正 赤 密 度 的 几何 表示 有 更 清楚 的 理解 ， 我 们 把 具 
有 等 洲 度 丢 点 的 扫 述 称 为 等 高 线 ( 面 )， 显然 当 了 2 了 一 2 时 正 吓 
《一 后 大 2pm 7 HN 


oi Tg 


天 


十 Cx = = cl {e 次 0 

它 是 中 心 在 《psazy 的 一 个 梢 图， 一 般 ? 维 正太 等 商 面 为 

(x— HIE (x— HT (ce 0) 
它 是 中 心 在 p 的 一 个 ?了 维 稻 球面 从 解析 几何 和 和 柴 阵 理论 知道 
由 于 了 祈 9， 存在 正 交 矩阵 了 一 《eet)， 使 得 三 一 了 人 
P'。 其 中 入 一 diag(4,, -…，4p)， 是 由 2 的 特征 根 4; 构成 的 对 
角 阵 ，e 是 相应 的 特定 向 最 。 从 布 37 一 了 AP， 代入 等 高 面 
方程 得 到 


[PCx 一 可 六 -EBPCx — p= oi 

好 

p 

(ex 一 eh” _。 

> 
若 令 yi 一 eix，vi 一 eip， 此 即 标准 烛 球 面 的 方程 ， 其 半 费 轴 人 长 
度 分 别 为 V4 ce， 而 轴 约 方向 正 是 ej， 酉 球 的 中 心 坐 标 为 《e 氏 
"ey, 


$2.3 焉 坊 向 量 的 来 件 分 布 和 相关 性 


在 第 一 节 中 已 介绍 了 随机 向 量 的 相关 系数 pj; 及 相关 第 阵 的 
概念 ，pii 表示 x 的 分 里 x; 和 *i 的 相关 程度 。 本 节 将 进一步 
介绍 随机 向 量 的 其 他 相关 性 度量 ,然后 得 对 正 态 分 布 进行 讨论 ,由 
于 我 们 仅 对 协 方差 矩阵 感 兴趣 ， 不 妨 假 设 稍 机 向 量 的 期 望 向 量 总 
为 零 向 量 ， 

《一 ) 仿 相 关 和 复 相关 

相关 系数 仪 反映 了 分 量 x; 和 * 之 间 的 相关 程度 ,而 在 实际 
问题 中 常会 遇 到 其 他 一 些 相关 问题 ， 例 如 某 一 分 量 与 其 他 分 量 的 
全 体 之 问 的 相关 关系 、 或 省 在 消去 若干 分 量 的 影响 后 ， 其 余 分 由 
的 两 两 相关 关系 ， 为 了 人 猎 壕 的 方便 ， 先 对 如 下 的 假设 条 件 进 行 讨 
论 ， 


5 This 


设 随 机 前 区 克 一 《xy 了， 其 中 3 一 (xs ，， "sp) 是 x 前 
后 ?一 1 维 子 向 量 ，Bx 一 0 以 及 
COVYCX) 一 卫 一 ( 


2 


Oa 
“)>0, BB > 0， (3.1) 
bm 


其 中 vn 是 ?一 1 维 向 量 。 
首先 我 们 希望 找到 y 的 一 个 线 件 组 人 台 . eey 来 估计 *,， 其 中 
ft 是 了 一 1 维 深 匆 向 车, 使 得 
Elrz,— ay C3,2) 
达到 最 小 , 即 Gy 与 4 的 差 的 方差 达到 最 小 。 
由 于 
E(x 一 Oy oo 200 十 本 于 
一 《co 一 Fionn) t+ Ca 一 Filg,) Fula 
一 2) 《3.3) 


显然 , 当 且 如 当 
a = £50 . 《3.47 
时 Btz 一 By》 达到 最 小 值 ca 一 ou 一 02 0 
因此 可 以 把 By 一 ca3ay 作为 x 的 最 佳 线 性 估计 , 它 使 得 
(3.2) 式 达到 最 小 。 . 
定理 3.1 在 上 述 假设 下 ,， 与 Wy 的 最 大 相关 在 Py 一 
ga.22y 处 达到 ， 
证 明 由 上 上面 记述 ， 对 于 任意 常数 * 及 任意 的 六 一 诗 维 疝 量 
& 总 有 
Elx,— cay) 2 E(x, — ByY (3.5) 
展开 {3.5) 式 后 得 到 
—2e0 0 十 ee Bd 2g 十 自卫 月 
选取 正 数 oe [B' Zu,Bia' Fra] 
于 是 


Bo, > 一 Ga . (P58) (3.6) 


《人 写作] 


Fe 


按 扯 关系 数 定义 


my ay) | 


ons oy) a 
[varx, * varCa'y )]s ouiCe' sa) 
<— Bo ~ pr,p'y) (3.7) 
中 (全 有) 和 

此 式 去 端 是 x 与 任 一 线性 组 台 er y 的 相关 系数 ， 右 端 是 x 与 
疗 y 的 相关 系数 ,也 而 当 ma 一 及 时 达到 最 大 相关 。 | 

我 们 称 x*, 与 一 切线 性 组 合 my 的 最 大 相关 系数 ptx, By) 
沪 # 与 y 的 复 相关 系数 《多 重 相 关系 数 或 全 相关 系数 ) 记 为 


-一 cn 


Bey 或 者 Paz 
信人 3， 7) 式 中 知道 ， 把 B= zaeGa 代 人 喇 有 
村 
pay 一 [| (3.8) 
它 有 关系 式 


pi 一 1 一 2 或 者 owl 一 pls) (3.9) 


其 中 pe 可 看 成 x 十 渭 愉 》 的 最 大 生性 双 应 后 的 方 
设 其 一 (xr ZY 是 一 p 维 隐 机 向 量 ,，z 下 pO—2 维 子 向 
量 ，ExX 一 0 以 及 


On ge gn 
covx) 一 卫 一 : on Uy 所 0, CB, > 0) 
Ja Oy Ba! 
令 qa'z 是 的 最 佳 绕 性 千 计 ( 它 楼 得 ”% 与 Wz 之 间 有 最 
大 相关 },，B8'z 是 局 的 最 任 线 性 估计 ,这 里 qa, 是 ?一 2 维 常数 
计量 。 那 么 如 上 可 求 得 - 
人 一 也 lo， b= Balgy 
从 而 消去 z 的 最 大 线性 效应 后 得 到 的 两 个 随机 变数 为 
Bs 


» Fs 


jz 的 相 半 乏 煞 , 记 为 Dj's 或 者 站 3 从 年 
COV(2 一 9 下 xca GER) 


[vartx, 一 oilz)》，var(a 一 25] 去 


Pr ™ 


一 《ai 一 Graceoaz) (3.10) 
《c 一 oyna ) Co 一 oT5'0) 
上 面 为 了 使 读者 能 深刻 理解 各 种 相关 关 涵 ， 岁 以 最 简单 的 形 
式 给 出 有 关 表 过 式 ， 而 在 实际 运用 中 只 要 了 略 作 变化 即 可 得 到 一 些 
形式 上 复杂 的 表 还 式 .、 例 如若 x 二 C(x， #0) 那么 让 ae 
表示 x 与 其 余 分 量 间 的 复 相 关系 获 。 又 如 pe 表示 在 2 一 
《xi os) 给 定 下 各 与 x 的 位 相关 系数 ,为 此 只 须 取出 了 中 
与 和 wss3 有 关 的 诸 行 , 诸 列 得 到 新 的 协 方 差 扎 阵 ,然后 撤 《3.107) 
式 计算 得 到 。 
(二 》 正 态 向 是 的 条 件 分 布 
本 眉 将 着 重 讨论 正 坊 向 量 的 条 件 分 布 及 有 关 概 念 。 
定理 3.2 设 ” 维 随机 向 量 x 一 NCp,2), 其 中 
EP HK Sl Dl 
he > > 
x, 是 r 维 , x; 是 :3 维 (十 rr 一 切 : 及 了 相应 分 据 ， 那 六 在 络 
定 x 后 x, 的 条 件 分 布 为 
Xx ~ NA SasnCx 一 pK)s E12) | 
即 给 定 x 后 x， 的 条 件 分 布 为 7 维 正 态 分 布 且 
E(x x) 一 pt BaZn 一 各) (3.11) 
COVCRL NR) = Bi > EL Oo— Tad, {3.12) 
证 明 ” 作 非 奇异 线性 变换 
| I Ea2n \/X, Xi — TuaZn x 
Oo -0 wR ) 


了 


由 定 进 2.2 知 . 
过 


PA 


由 定 湿 2.5 知 y， 与 相互 独立 有 
yi 一 Xi Padax ~ Nh — Su2D .2) 

有 从 而 当 xs 给 定 后 

上 人 NCHh, 十 EBX 一 2) ， 之 ,2 。 | 

此 时 我 们 称 方程 

一 ECX NX) 一 pt BBallX; 一 pF) 
为 x, 关于 x; 的 回归 井 面 (或 回归 方程 ,市 系数 了 02 称 为 *， 
关于 x; 的 回归 系数 矩阵 ， 2-: 称 为 x, 在 x: 给 定 下 的 条 件 苏 
方差 矩阵 ， 
若 > 一 1， 此 时 *， 的 最 佳 线 星 估计 正 是 x, 关于 x; 的 回归 


平面 ， 
若 记 了 .一 《aiiv+oe7， 它 是 上 x 上 阶 矩阵 , 则 称 
Tijrrtn EE F 
站 时 二 一 


War ”加 证- 
为 给 定 x; 后 x， 的 分 量 办 和 9 的 条 件 相 关系 数 (i，j 一 1， 
2;,……:*)。 与 (3.102) 式 比较 ,可 以 知道 : 当 x 服从 正 态 分 布 时 ,在 
Xx; 给 定 条 件 下 x, 诸 分 量 的 篇 相关 系数 正 是 它 的 条 件 相 关系 数 ， 


为 此 只 须 记 
村 , Gz Fs, o 0 
ZZ : Ty | 2 一 人 家 
2L 23 


Ty Ty Za 


于 是 , 
EC ) easa 


1 Oar 3 
os (人 一 OPH0, ia 一 7 ee) 
Or 一 DEMO oo 一 GT35Os 


eo fe) 


即 可 牌 出 ， 
B80。 


注意 上 述 结论 " 伪 相 关系 数 签 于 条 件 相关 系数 " 仅 对 正 态 分 布 
成 立 , 其 他 分 布 时 求 必 成 立 。 

另外 若 + 一 1， 由 定理 3.2 知道 在 x; 给 定 下 4 的 条 件 方 
盖 为 

Ti = 人 | 一 FE 

与 (3.9) 式 ow ol — pp) 
相对 申 ,说明 x, 在 x， 给 定 后 的 条 忻 方 差 小 于 它 自 身 的 原来 方差 
9， 上 且 若 % 与 x， 的 复 相关 系数 绝对 值 越 接近 于 1 即 x. 与 x， 
的 线性 相关 程度 越 大 , 则 条 件 方差 越 小 。 

例 31 在 例 2.1 中 


GC) os, 
那么 在 5 给 定 条 件 下 的 条 件 分 布 为 


rt ~ N (4p, 十 oC — £2) 01 一 由) 


oa 一 ct1 一 PY) 正 是 条 件 方差 ， 为 关于 x 的 回归 直线 为 


mp or xo— p2). 
.GC 


(三 ) 偏 相 关系 数 的 递 推 公 式 

根据 (3.10) 式 我 们 可 以 求 出 任 相 关系 数 , 然 而 十 分 不 便 , 我 们 
希望 找到 一 个 递 推 公 式 ， 能 够 以 简单 的 相关 系数 pi 出 发 求 出 所 
需要 的 偏 相 关系 数 。 为 此 我 们 介绍 下 面 定理 ， 其 证 明 将 在 本 章 的 
附录 中 给 出 。 

定理 3.3 偏 相 关系 数 存 在 下 列 递 推 公式 
Pijrgtarnp YY igrgtirerp " Pliggtirenp 
V1 一 PH Vl— Pig rgtis np 

班 这 个 公式 可 以 根据 fo 计算 由 {pijp】 再 计算 出 
tpijrp_ pts 四 etassrsp 等 等 。 常用 的 有 


站 了 sp 


= 81 ， 


2 一 -一 一 3.143 
" V1i— plo ‘ 
因此 只 要 知道 相关 姑 侨 ， 那 么 各 种 偏 避 关系 数 记 就 完全 确定 了 . 
例 3.2 ”在 制订 服装 标准 时 , 需 抽样 进行 人 体 测 时 ， 今 内 女子 

身体 测量 中 取出 部 分 结果 如 下 : x1: 身高 wy: 胸 周 ，w,: 腰围 ， 
2: 上 体 长 ，xs: 冉 围 。 经 计算 知道 这 五 个 变量 的 相关 和 持 阵 为 

1.000 

0.216 1.000 

R= |0.054 0.732 1.000 
0.648 0.242 0.133 1.000 
0.368 0.676 0.627 0.376 1.000! 
首先 可 以 着 到 ps 一 0.648，pzs 一 0.732， 这 说 明 上 休 长 与 身 
高 , 胸 轩 与 桔 围 之 局 存 在 较 大 的 正 相 关 , 而 os 一 0.054 说 明 身 高 
与 厢 围 仅 存 在 瓜 徽 弱 的 正 丰 关 , 儿 乎 是 瑟 不 相关 的 ,下 面 我 们 计算 
人 帆 相 关系 数 pases 和 pagvus 
pus = [0.133 一 0.627 X 0.376]/V 1 — C0.627¥ 
sl — C0.3767 = —0.1423, 
pis = (0.732 — 0.216 X 0.054]/V 1 — (0.216Y 
.ANAL 一 {0.054): = 0.7388, 

比较 p， 和 ps， 知道 版 鸭 和 网 韦 即 使 排除 了 身高 的 影响 后 仍 高 
度 正 相 关 。 然 而 从 mm 和 和 ess 的 比较 发 现 , 把 辟 国 的 影响 去 除 后 
上 体 长 与 宝 转 变 成 了 负 祖 基 。 这 正 说 明了 交 性 主要 特征 性 国 造 成 
的 变化 ， 因 此 我 们 从 变量 的 租 关 系数 说 明 变 鞍 的 相互 关系 时 要 十 
分 慎重 ， 


$ 2.4。 正 态 随 机 矩阵 的 若干 性 质 


本 节 着 重 讨论 正 态 晨 机 和 阵 的 一 些 性 质 。 
设 X 是 请 Xa 阶 随机 和 撼 阵 , 好 是 捐 X 阶 常数 抵 阵 ,三 是 疡 兴 


= 82， 


p 了 守信 PP 是 # x # 阶 非 负 江 算 阵 , 卫 记 
= CR Ra CRs Xp) 
一 《PT ‘Ry 

定 头 4.1 3 vecX ~ NoslvecM ,ZF)， 则 称 随机 姑 陈 
和 服从 正 态 分 布 We 于 ,SF 

若 M 一 0, 了 一 1 上， 一 1。， 则 称 关 服从 标准 正 森 分 布 
,0,1,,1.)。 此 时 义 的 各 元 率 都 相互 独立 且 ~NC0,1). 

如 果 rkC3) 于 +， TC 一 ?0 之 rf 和 p00 之 :之 #) 那么 
在 在 秩 为 + 的 了 xr 阶 扰 阵 4 和 秩 为 :的 Xs: 阶 和 矩阵 8B, 使 得 
ZZ 一 A4 和 下 一 了 8 类 似 于 定义 2324， 我 们 可 以 给 理 另 一 等 价 
定义 : 

定义 42 若 P? x # 阶 随机 算 阵 区 可 以 表示 成 

X= M+ AYB 

其 中 Y 是 > x: 阶 随机 短 陈 一 和 Ni,C0,1.s11) ,A 是 秩 为 1 的 Px 
阶 矩 阵 , B 是 牧 为 ?的 #XxX; 阶 韦 阵 ,MM 是 了 Xxx 阶 当 数 第 阵 ， 令 
3 一 44 ,VV 一 BB， 那么 称 XX ~ NM,E 7) 

从 定 必 中 我 们 可 以 看 出 下 列 几 个 性质 : 

1 列 向 量 zi ~ N,(pj, v2) 

2) 行 向 量 xco 一 站 (RoyonT) 

3Y covtr, ri) = yiD 


4) cov(ron tn) = GIF 


5) COY{ si Ar) 一 人 

6) KX ~ NM V2) 
其 中 了 一 Co pps V= (Vr ene 

由 此 可 看 出 天 的 诸 行 ( 列 ?都 是正 态 分 布 状 的 ， 人 得 不 一 定 是 相 
互 独立 。 

当 三 和 了 都 是 正定 扎 阵 时 ，vecX 的 密度 可 写成 


weeEy = C22) | EO temp 一 二 CveaX 


" 3" 


一 Yecp DT 区 ICwecX 一 vecp)} (4.1) 


利用 | 了 多 | 一 | 了 Ti 以 及 vecCAXB) (ABB Jrec 不 
VEeC vecY on trXY, (SOVY! = SF OV 
那么 我 们 可 把 (4.1) 改 写成 
KO QF EL IV | ket (~— 2 5AX— MV™ 


.CX— M) z (4.2) 


其 中 etrt*)》 表 示 exp{trC*)}。 

在 实际 问题 中 经 常 恨 定 被 证 究 的 对 得 服从 多 元 正 术 分 布 ， 但 
参数 中 及 王 是 未 部 的 ,这 时 我 们 必须 从 总 体 ~ An) 中 抽取 
站 个 独立 样本 x, ,Xx， 来 估计 pg 及 了。 这 和 时 有 一 《xi 
Ta) 被 称 为 观察 值 矩阵 或 样本 资料 逢 阵 。 利 用 上 面 记 号 ， 若 再 记 
Mpp ppl, 

1。 表示 元 圳 全 为 上 的 2 维 列 向 量 ) 那 么 可 简 记 为 
其 一 【xz RE 
而 于 的 密度 可 写成 


KX = 7) [5 ctr {— x pL)X pl) 


(4.3) 
以 后 在 讨论 参数 估计 和 假设 检验 时 ， 总 用 上 述 记 号 表示 样本 随机 
矩阵 


下 而 我 全 讨论 随机 竺 阵 XX ~ 和 ,wn(M ,3， 7) 的 若干 性 质 。 
定理 41 如 果 XX~~ 入 ,M2,V)， 有 4 蚌 加 Xx 了 阶 引 队 ,8 
是 # Xx : 阶 短 阵 , 则 
ARB ~ Nau(AMB,AEA,BVB) 
证 明 此 时 vecX ~ N,nCvecM 的 FF 
所 现 
+ B14 +* 


vec( AXB) = (ADB' Yrech ~ Nal (ADB' Nech, 
(CABBIEBNCADE) 
只 
vecCAXBY ~ Noulvec( dB 的 8T 昌 D) 
撤 定 义 得 
4XB ~ NAAMB,AEA' ,BVB). 由 
对 于 下 的 子 第 阵 的 分 布 ,只 须 在 定理 4.1 中 肥 4,8 为 特殊 算 
阵 即 可 得 到 。 
例如 ,车 记 天 一 Mew 于 ,了 :77， 黄 中 
i MM, MM, ZE 王 1 
和 一 x MT (ye Mr， “一 Gs Eas ) 
， A Vy 
“一 [ 中 
其 中 Rn,M 是 7 x s 阶 答 阵 ，Z,， 是 > Xr 阶 非 负 定 知 阵 , Fu 
是 有 x: 阶 非 负 定 算 阵 ,那么 芒 , ~ NM,2osV ,7)， 下 时 相 尖 


于 取 4 为 rx 也 阶 第 降 (1..0),B 取 # x = 阶 矩阵 ( “) 即 可 ， 


定理 4.2 设 四 改 N,.aCM ,EY), 上 4 是 # Xr 阶 算 阵 ,8 是 
nX# 阶 算 阵 ， 则 隔 一 XA 和 ZZ 一 B 相 五 狂 立 的 充分 必要 
条 件 是 《TB 一 0。 

证 明 ”只 须 证 明 vecX 和 vecY 相互 独立 的 充分 必要 条 件 是 
4VB 一 0。 由 定理 条 件 知 道 | 

vecY = (1A ecR ~ NeslvecM A, TOAVA) 
vecZ = (JB vecX ~ NervrecMHB ,THBTE). 
vecY 和 vec2 相互 独立 的 充分 必要 条 件 是 
cov(vecY vecZ) 一 cov((IO A IvecX, (1B IvecX) 
一 他 的 和 2 的 了 并 7 的 有) ~ 2BAVB 
=—= 0, 


由于 3 不 恒 为 零 。 即 为 4VB 一 0,， 重 


明 #5 na 


业 似 地 可 以 证 明 ， 

定理 43 设 政客 NN,,,( 导 ,了 ,VY4 是 六 X 自 阶 矩 阵 ， 吾 丐 
f 尖子 阶 上 矩阵 , 刚 了 一 AX 和 2 一 BX 相 蕊 独立 的 多 分 必要 条 
件 是 A3B” 一 0， 

下 面 我 们 求 着 ~ NG,aCM ,>,V) 相应 的 特征 疯 数 ， 

设 了 一 《6 十 伍 意 的 了 xX # 阶 实数 个 泗 , 则 recX 的 特征 
汲 数 为 


xp liveeT’ vecM 一 = vecT"(Z@V vecT) 


由 于 
vecT vecMd = trT'M., 
vecT (POV vecT ~ vecT vec( STV trT’LTV., 
所 以 于 的 特征 国 数 为 | 
px(T) 一 玉 [exp(itrT' 和) 一 exp iteT”"M 一 Tr’s7V} 
(4.4) 


与 蝴 机 向 量 一 样 ， 正 态 随机 矩阵 也 可 用 它 的 特征 消 数 来 等 价 
地 定义 ， 读 者 可 自行 推出 正 态 随 宙 和 矩阵 的 名 种 性 质 。 


习题 一 


2.1 已 知 二 维 随 机 河 最 (x,y)” 有 密度 
jx ) = 和 立 守 * 苇 1， 这 1 
"lo, 其 但 

试 求 17 联合 分 布 函 数 Fx,y)， 

2) 边缘 分 布 函数 Fitx) 和 这 入 窗 麻 fr) 一 1:2。 

3) 条 件 分 布 密 旗 fCx1yY) 《注意 车 大 zy 风 一 0 刚 定 多 信 #01y0) 呈 
07》。 

4) 证 明和 3 独立， 

2.2 说 * 的 分 布 图 数 F(x) 在 s， 处 连续 ，? 的 分 布 函 数 FY) 在 

% 连续, 试 证 硼 Lxyy》 的 联合 分 布 苞 数 下 gp 中 在 《esyo7 四 韦 绒 . 【这 


+ B66 * 


捍 假 十 FCx,y) 存在 ) 
2.3 证 荆 一 (xis 1》 有 特征 函 烧 
| bof) = ole ta? 十 1 二 Bei 4 Ba!?s, 
甚 中 ob 是 满足 +b 一 订 的 正常 族 ， 求 x 的 协 方差 算 降 。 
提示 :， 和 用 特征 末 数 人 性质 习 ， 
2.4 利用 特征 本 数 证 骨 当 x#~pC052)C 寺 中 一作 9 加 
一 《0iizxp) 时 ;有 
1 Byizirzt = O 
2) Eyixishs: = THR 十 GT 十 Heh 
2.5 证 1 分 别 是 三 个 连 纺 型 殖 机 变量 。 本 1 和 Ei 有 二 阶 算 存在 
证 明 
1) Ex, 一 五 | Kx | xz) 
2) vars) 一 了 [vatfsilzt) 1 十 varEfz zs 
了》 covCriyw2a) — Bleorta sms|w) 十 cov[Ber le) EC#sl #3)], 
提示 刑 用 方 莽 和 协 方 淮 的 定义 。 
2.6 设 一 (rs 一 Na(。 2)。 卫 = ( ， ， 小 试 求 出 一 个 姑 隆 4 


使 得 * 一 4?， 且 是非 奇异 正 态 分 布 , 并 给 出 ? 的 分 布 密度 ， 

2.7 设 < 一 (zuxa) 有 窗 度 

fry #2) = 二 C23 {- 士 (Br! 十 wl Peins 一 225 ~ 1 4#, + 65)} 
求 : 4 一 Ex 和 卫 一 cov(x). 

握 示 : 将 忒 rssxi) 寺 成 正 态 分 布 密度 的 矩阵 形式 (2 , 扫 。 

2.8 设 = 一 (xz zy 有 密度 


人 
jes 5) ~ 上 人 
By 其 他 ， 
证 明 *。 和 *， 的 边缘 分 布 是 正太 分布 ,但 * 不 是 二 元 正 态 分 布 
2.9 已 知 = ~ (xisrosmm) 的 协 方差 炬 为 


5 2 3 
sor(x) = Fo |j2 3 0|， 
对 有 之 


2 
1 


Ea EH 
+ 0 


= 7 。 


1 法 rarfzi 一 2x; 二 wa], 

2) 设 二 和 十 #9 站 二 和 十 4 生生 求 cor(yi972》。 

2.10 已 知 rr 狂 立 晶 服从 相 层 分布 NCE30)， 求 9 二 ox, 十 朋 #， 
和 为 一 “xi 一 Ra; 的 相关 系数 。 

2.11 设 + 与 诺 y(ti 二 1.…sn》 都 不 相关 ， 证 月 对 于 枉 意 si(i 一 1， 


与 之 ， eiyi 不 期 关 。 
2.12 设 关 一 《sxiozi 了 ws 和)， 求 
,+ Xt, 


ti tx 


二 


的 分 布 密 魔 . 

如 示 : 和 堵 碟 在 给 定 +; 荣 秆 下 3 的 仓 布 , 它 是 正 态 变量 的 线性 组 侣 ， 求 
出 其 xyy>》 后 再 求 ? 的 分 布 密度 ， 

2.13 证 明 特 征 函 数 的 性 质 1, 2,5。 

2,.14 设 < 一 (es #2) 一 N00)、。 求 在 #2, 十 # 给 定 下 #， 的 荣 件 
分 布 。 

提示 : 先 求 > 十 *， 的 联合 分 布 ; 表 求 条 件 分 布 . 

2.15 证 x 一 NtpR 3s 其 中 B= py Todi, 一 证 一 


1 +: 、 
P 1r1o， 求证 


ECx’ Ax) = (Fp — Do 
提示 : 利用 定理 1.5， 
F165 设 和 友 四 3 五 ]， 五 >>0 和 一 【xziyasxspr 定 史 
logy 一 《logyieoylogyr) 若 z 一 1ogy; 有 上 述 正 态 分 布 ， 则 称 ?> 服 
从 了 准 对 数 正 潭 分 布 ;证 明 它 的 密度 为 


{27) si 区 > ex {六 Clogy 一 prClogy 一 上 
Ky) 一 


Cyi> 0 i la'rrsp)s 
0, 其 他 ， 
并 证 明 
1) Ey; = exp {ri 十 二 "oj 村 


#4 


:机 NN 


2) vatfy 门 = exp{2p + 200} ~ exp{2hi + Fi}, 


附 录 
在 这 个 附录 里 我 们 将 证 明定 理 3.3“ 偏 相关 系数 的 选 推 公式 ”。 由 于 下 
态 分 布 条 件 相关 系数 等 于 愧 组 关系 数 * 我 们 只 须 推 导 正 态 分 布 的 条 件 相关 系 
数 的 递 推 公式 。 为 此 我 们 先 证 明 一 个 引 埋 ， 
引 理 3.1 设 # 维 绢 机 向 量 x~ 和 Net0,5)， 其 中 


TL P. 王 :， EL Ly 
| ET =| Es, Es Es > pi—=p 
41 
x #, #1 Ta: Ta 


tz9X 分 别 为 pisP19P， 维 子 向 级 。 那 么 有 


EE -一 【五 瑟 并 和 ") ! ( ”) = 对 一 五 了 开 C1y 
机 - 1 - 和 
i 9 1 3 Ps [Ee 和 


这 里 
3 
证 表 记 x 的 分 布 密度 为 1x 2 为 )， 相 应 于 x: 的 边缘 密度 为 
4)。 庄 x 给 定 下 x 的 条 件 密度 为 Cx;1*1)。 于 是 


大 3zsx3) Hx ox oa f(x) 
Hw) x xs) fx Es) Hy 3) fC) 


TT | 3) = fix 
Cx: |x3) a ‘| 


Ny 四 


因此 


covf x |xas ry) = covix,|*, 


x,) 


而 cov(x | as 正 是 在 (x:; xs) 给 定 条 件 下 x 的 条 任 协 方差 移 阵 ， 即 
(1 式 的 志 问 表达 式 。 
另外 在 给 定 后 【xsx:)》 的 条 件 协 往 莞 矩阵 为 


co 的 )- (人 2 一 人) Tins Fn) 
-人 
此 时 x， 关于 xs 给 定 下 的 条 件 协 方 莽 短 陆 为 
旦 89 中 


Gov wil [= 一 i Es ,Eg 


与 (1) 式 右 端 相同 , 引 理 得 江 ， 和 

引 悍 3.1 告 沂 我 们 ，x, 在 (%，*w】 给 定 下 的 订 任 于 方 凑 矩 阵 与 先 计 
x; 给 定 再 求 *; 给 定 下 x 的 条件 协 方差 矩阵 相同 : 即 x 的 条 件 协 方 攻 征 
上 隆 与 mx 的 给 宅 次 序 无 涯 。 

定理 3.3 的 证 明 : 

在 引 理 3.1 中 令 站 一 9 一 1 和 一 1 pf 一 了 一 9 于 是 氏 1) 式 中 左 说 
和 右 端 各 和 卸 阵 的 元 素 分 别 为 


CO | Xess) 一 【和 一 (Oar grit) 


lr 一 (oraratts .rp) Ey = gratiosp 
从 而 5 该 元 素 写 出 正 是 


他 1 
ii = 全 一 lp ta (C2) 
a 


年 (2) 式 中 令 下 一 入 


fed 
EE EA 
人 Ti 4 一 2 和 ) (3) 
Tagaqttesp Odiieetlrrp 


+ 
= Citraptys st tl 一 iarqttssp) 


而 Perye = Cig PE {4) 


将 “2 和 (3) 式 代入 (4) 忒 之 中 得 到 


LT 
Tipgtisat 一 Give 


By 全 = -or 
WO cat ot 一 站 +) 一 


i Dig 从 上 
Vn 
ig"etls sp ia: tls 


= 和 全 全 


第 三 章 Wishart 分 布 和 7?- 统计 量 ， 
A- 统计 量 的 分 布 


在 本 章 中 我 们 将 讨论 与 多 元 正 态 分 布 有 着 密切 关系 的 若干 重 
标的 分 布 ， 苯 中 Wishart 分 布 是 一 元 统计 分析 中 从 分 布 的 自然 
推广 ，Hotelling 7* 分 布 是 一 元 :分布 的 自然 推广 ,而 Wilks4 统 
计 皮 的 分 布 与 一 元 分 布 有 着 密切 的 关系 ， 为 了 与 一 元 绕 计 中 庄 
分 布 进行 比较 ， 我 们 将 在 第 一 节 中 较 详 细 昌 探讨 关于 二 次 型 分 布 
的 一 些 结论 。 


§3.1 关于 二 次 型 分 布 的 一 些 结论 


本 市 首先 回顾 一 下 一 元 统计 中 常 月 的 六 分 布 ，# 分 布 和 FF 
分 布 的 定 尽 ， 然 后 对 二 次 型 服从 玉 分 布 及 其 二 次 型 粗 互 独立 的 
充分 必要 揪 件 进行 讨论 ， 

《一 ) 和 分布, 分 布 ,下 分 布 8 分 布 

《1) 闪 分 布 

设 ? 维 随 贞 疝 量 zx 一 (xx) we， 1,)， 我 们 称 戎 


机 变量 y 一 x'x 一 > 好 服从 自由 度 为 p, 非 中 心 参 数 为 1 一 


RE 一 > x? 的 非 中 心 入 分 布 。 记 作 了 一 MKp2)。 当 1 一 


时 , 称 7 服从 自由 度 为 的 中 心 龙 分 布 。 记 作 ?~ 好 (p)。 


容易 证 明 ( 留 给 读者 》: 

车 yw~ 如 (pp 则 

1) Ey~— p++1 (C1.1) 
2) varly) 一 2p 十 物 01.2) 


* di: 


下 面 我 们 计算 y ~ Xp,14》 的 特征 函数 ， 


二 
gif 一 瑟 expfiry) 一 [|[ ECexpix?) 
j=l 


Lp 一 工 《2 一 对 全 
站 2 


-全 襄 = 人 一 忆 生 ) 
十 -| ii 
1— 2 
一 (1 2 exp{irn}/ C1 — 2i7)} 
从 而 
Xp,4) 的 特征 函数 为 


Pi 1 一 2 到 exo( -2 ) (C1.3) 


当 1 = 一 0 时 2(o) 的 特征 陷 数 为 
PI = C1 一 2 {1.4) 
从 一 元 绕 诗 分析 中 已 知 当 了 ~ 六 Cp》 了 时, 它 的 分 布 密 认为 


fy; P) 一 [ (2) |] i ee 这 ”) ”> (1.5) 
0 其 他 


6 和 


按 寡 加 数 展开 得 到 XC(p,2》 的 特征 函数 可 展开 成 


ra 
(t= {1 — Zi fox ( F ) 
Pi 7 { 7) Pp 1 2 


由 于 


工 [之 ) C1 一 2i1)- ?th 


j= 也 


一 
m= pg 2 


"2 


根据 特征 徊 数 的 叭 一 性 定理 立即 可 得 了 ~ (p14》 的 密度 为 


hlys Pp)— 2 Wi) » ysp t 21) C1.6) 


其 中 meK27 一 1 (2) co- 和 正 是 参数 为 之 的 Poisson 概率 分 
11 “2 2 
布 的 第 7 项 概率 ,站 Ky;o) 正 是 Ca》 的 帘 变 表达 起 


《2) 分 布 
设 ~ NC6,1),， 7 ~ Xr) 旦 xz 与 了 相互 独立 , 则 称 随机 变 


量 = 一 *//A/ 广 ?服从 自由 度 为 ， 非 中 心 参数 为 2 一 2 的 
分 布 , 记 为 = ~ zas4)， 当 4 一 0 时 称 # 服 从 各 由 谋 为 # 的 中 心 


?分布 , 记 为 zx ~ C4). 
按 一 元 统计 知识 知道 当 z ~ 2(#) 时 有 密度 


和 了 (2 十 1 
2 tt 
fr CO 十 FP) i . C1.7) 
fr I (=) 
当 z ~ 站 #,4) 时 有 和 窒 度 
htsn)— 3 a 


Vrrl2 D2) (十 四 


. 1/ 
rt 


1=0 
C1.8» 


《3) 于 分 布 
当 ~ 与 相互 独立 ， 则 称 随 


机 变量 = 一 小 * /上 y 服从 家 由 度 为 严 和 #， 菲 中 心 参数 为 2 
和 > 的 两 量 F 分 布 ， 记 为 # ~ Fim nd yy), 而 当 一 0 了 时 称 = 
”多 了 “ 


服从 家 由 度 为 放 和 #* 非 中 心 参数 为 入 的 下 分 布 , 记 为 > ~ Ftm， 
nA4)。 当 4 一 9,2 一 0 时 ， 称 =z 服从 自由 广 为 w 和 的 中 心 F 
分 布 ， 记 为 x ~ 了 (mi#) 今后 我 们 仅 讨 论 Plmsn,1) 各 Fim， 
1), 

不 C41.5) 科 K1.63 中 已 经 给 出 了 x* 一 和 Km 和 ?~ 淹 (n) 的 


分 布 密 度 , 由 此 不 准 得 到 :一 二 * 和 一 二 y 的 密度 为 ts) 
和 A ， 那 么 xz 一 sft 的 分 布 密 话 为 


te mn) 一 | 1g{C zi YR) ds 《0 < co) 


进行 逐 项 积分 , 稍 加 整 涅 芳 得 “一 FCm,n,4》 的 分 布 窒 度 为 


frm) ee > £2) 2 ) (9) 
其 中 


-1 
cr 一 B( 宇 二 和 三) 
2 2 


WA) 


当 久 一 0 时 z ~ Fltmsy#) 的 分 布 密度 为 


7 季 ? 十 此 
_ To) 9 33。 2 
fz, 2) © (2) 3 9 Cn 
《1.10: 
平面 起 与 已 分 布 有 密切 头 系 的 有 分 布 ， 
《4) 记分 布 


Tep 士 9 (x) 0<e<l 
J Tr” 人 - 


0 其 字 
+ 94» 


虽 称 * 眼 愉 参数 为 py 的 8 分 布 , 记 为 过 一 所 DG 
设 ~ PCp,9)， 则 容易 计算 * 的 证 阶 姑 为 


Exs a Lip+ DIP hk) (1.11Y) 
rprp+ on) 


且 可 以 证 衣 的 分 布 是 由 它 的 各 阶 滤 唯一 确定 豚 。 
下 而 几 个 性 质 是 很 有 用 的 。 
i 如果 ww ~ 2) 如 扩 司 FCl, 4》。 
i》 设 ,x 相互 独立 且 部 服从 站 Ca)， 则 


8 一 V nF a) ~ zn Om 1,1) (1.12) 
1 间 
sr 之 (xi 一 到 


其 中 2 一 上 上 yw 1 一 5 三 A， 特别 当 a 一 时， z~ 必 a 一 


1), 
iii) 设 zy XY 全 部 相互 独立 ， 而 一 WCGCas ce 
(s ™ 1 Fi ~ Co 二 上 则 


3 


-一 (ai 一 区 
m1 ft 


~ Fim— ln 1) (1.13) 


“i 
由 于 
+ gs, 


xz 一 上 z/ 工 y ~ Flim,n), 
3 i 


于 是 有 


ls Fm,n) C1.14Y 


nr 9 


在 下 而 各 章 讨论 假设 检验 时 经 常用 到 上 述 各 分 布 的 分 位 点 。 
以 后 将 记 感人 (2 表示 站 (ww) 的 下 侧 & 分 位 点 , 即 如 x ~ 关 (n)， 则 
有 Piz 过 鹤 (#)) 于 gg， 类 倪 的 有 tlwn》 和 Cm,#n)， 不 再 一 一 
说 明 ， 

二) 二 次 还 的 分 布 

设 卢 维 随机 向 量 x ~ 入,(0,1,). A 是 ?Xx 了 阶 对 称 矩 阵 , 首 


先 我 们 考虑 二 次 型 了 一 x4xz 一 2 oijxixi 在 什么 条 件 下 服 


1=1 jis] 
从 关 分 布 。 为 长 我 们 先 计算 ? 一 x Ax 的 特征 函数 ， 
设 rE(4A) 一 >， 按 第 一 章 定理 3.1 ,存在 正 交 阵 了 ,使 得 
PAP’— A= diagChis "sd 0 0 
其 中 1,……,4 是 4 的 非 零 特 征 根 。 令 xz 一 Px， 由 第 二 章 定理 
2.2 知 仍 服 从 NeC0s 7)， 此 时 ?可 写成 


一 于 4z 一 Fs 《其 中 蕊 一 《2 


内 此 的 竺 钙 函 教 为 ， 
Pr) = ELexplity)] 一 Blesp(i 之 2 


i 


而 


Elexplihi "1 4)]— | :exp|— 二 1 十 i 对】 dz 
1 


。 36 ， 


一 《1 一 2641 二 
因此 


Ps) 一 JJ (1 一 21 二 一 | — 2 和 人 | - 坦 (1.15) 


jim 
对 此 只 须 注意 到 
li— 2i4l ~ IP 2Al1P| = [1 0 — 2i2) 


定理 11 设 x~N,(0,1,),y 一 x*4x， 共 中 4 对 称 陈 。 则 
y ~ XA(s) 的 充分 必要 条 件 是 
有 一 4 和 > 了 一 TCD) 
证 明 ” 槛 证 明 y ~ ;NGs)， 只 须 证 明 它 的 特征 函数 (1.15) 与 
zG》 的 特征 函数 (1.4 对 于 所 有 实数 * 恒 等 。 即 对 于 所 有 实数 
有 


G 二 20- JT O21) 
二 1 


一 I [1 一 和 二 《1 一 2 和 《1.163 


王权 了 
记 站 一 上 一 2 《163 可 朴 写 为 
,fT ,Tr 1 一 2 
mr (I 1) II(” + ) 
比较 多 项 式 的 指数 和 系数 。 得 到 (1.16) 相 等 的 充分 必要 条 性 是 
+ 一 YY 一 Id) 和 21™— 1 人 一 1 7 


， 盾 者 即 4-( 路， 从 而 


A~—~PAP~ PAP.PAP= A 
即 4 是 对 称 虹 等 阵 ， 定 理 得 证 ， 罩 
我 们 将 不 加 证 明 给 出 下 烈 定 理 ( 参 考 [151)。 


.97 。 


定理 1.2 设 xp ES 了 > yy 一 x Ax, 4 为 对 称 

阵 ， 则 了 ~ (sp24)》 的 充分 必要 条 件 是 
DD) A AEA Di kd) i r=— pAp (1.17) 
特别 好， 如 果 定 惠 中 下 一 0， 只 须 令 一 33x。 此 有 时 z ~ 入， 
(0,15)》 且 yy 一 有 52343#z, 由 定理 1.1 知道 ~ 和 (se) 的 充分 必 
要 条 件 是 


(CEEATE) = {TAEEY 和 so rk( TAD#). 
由 2 之 0, 知 六 C1.17) 成 立 ， 
推 沦 1 证 x 一 NCp, E>0, 则 (人 xz 一 县 2 一 
bp ~ Ep) 
证 朋 留 给 恋 考 。 
下 面 给 出 两 个 二 次 型 相间 独立 的 充分 必要 条 件 ， 为 此 我 们 先 
证 明 下 述 引 理 。 


让 
引 理 1.1 设 4,…, A( 是 对 称 阵 ，4 一 >) 4i 且 


[EE 


1) 4 是 才 等 阵 
2) A1— BB, 


那么 Ai* 4; 一 0(i 二 人 门 , 且 A( 是 察 等 阵 ,， 了) (A) 一 T 上 (A). 


证 明 令 4 一 1 一 4, 由 A 罕 等 对 称 , 知 4 也 客 等 对 称 且 
7 一 如 十 机 十 二 4 于 是 对 而 好 一 09 1， 天 一 1) 有 
4 十 4 十 A 

令 Pj 一 有 4B) 其 中 括号 中 
少 一 项 4。 那么 利用 荣 件 1) 可 得 


中 
pi* P'~ 4 (D> 二 一 4 一 人 一 01, 天 一 1 


所 网 ECPi = EPP = 0 My Pi— 0 
秋 是 
"DF" 


4 一) 


= AB-0 (人 一 0 1 一 1) 
及 向 ， 
4 一 ABB 0 人 一 001 大 一 拉 
| 
41—(D 4) A A 
二 由 


由 A 是 考 等 阵 , 而 宪 等 阵 4 有 rk4 一 tA4， 开 则 可 知 


此 
> rk(4) 一 rk(L4)。 国 
定理 1.3 设 ~ Np Tp) A, A 是 Xx 了 阶 牌 等 对 称 阵 ， 
则 xx 和 x Asx 相互 独立 的 充分 必要 条 件 是 
4 一 0 


证 明 ”必要 性 : 

按 定 理 14.2 知 天 -4 和 ri 和 3 其 中 于 I(AD, hi 
下 4 一 12 ， 令 4 一 和 十 由 于 大 4x 和 XAsx 相互 
狐 立 。 从 它们 的 尾 征 函数 《4.3) 的 履 积 并 即 可 知 x AX 一方 十 
rs 十 和)。 仍 由 定理 1.2 知 4 是 宏 等 对 称 阵 。， 于 是 由 引 理 1.1 
知 A4; 一 0, 

充分 性 ; 
由 A1,4s 的 老 等 性 知 XAx 一 (AXxYCAx) (=1,2) 
而 4ix 是 x 的 线性 组 合 们 服 愉 正 访 分 布 , 且 

COVvCAX AX) — Acovix)A; — AL* A~—0 

所 以 4x 和 4,x 相互 独 了 ， 利 用 第 一 章 定 理 1.3 知道 它们 的 二 
数 x’Ax 和 x Asx 也 相互 独立 。 遇 

引 理 1.2 设 44， ,A 是 # XH 阶 对 称 阵 ，rk( 4) 汪 四 


二 
(i ly RR) A— SA; rkCA) ~ p. 


对 于 下 烈 皮 个 人 条件 


a A9 ， 


1) 4， 都 是 袁 等 阵 《一 1 让 
2) 4 Ai 0 (人 
3) 4 室 等 阵 


各 


4) p= Dr 


有 区 下 结论 
a) 1),2),3》 中 任 两 个 条 件 可 推出 其 他 两 个 。 
b》3),4) 案件 可 推出 1), 2). “ 
定理 1.4 设 x~ NCR,D),D > Oy = x AX = 1 ', 


点 
妇 且 ?了 一 六 | 有 一 和 dz。 那么 对 于 下 列 四 个 条 件 


和 yi CF CE 1 kA 
HAip 
2) 入 5 相 豆 独立 


上 下 
3) y ~ KCr, 2), 其 中 ”一 Sr, i— SN 


im 


+ 
4) rECAY 一 六 rkK Ad 


和 有 下列 结论 
a) 1),234:3) 中 任意 两 个 条件 可 礁 出 其 他 两 个 ， 
b) 3),4) 二 条 件 可 推出 1), 2). 
点 
证 明 ”由 于 4 一 >， 4;， 按 定理 1.3 和 定 刺 1.2 知道 ,上 述 
四 条 件 等 价 于 ， 
1》 3533.43 是 紧 等 对 称 阵 (一 1， 和 
2Y (BEA ZEN TIA TE) 0 
3》 58455 是 寡 等 对 称 阵 
» TO * 


| ' 
4) ek(CESEATS) 一 DY) rkCEIA,TE). 


1 一 1 
利用 引 理 12, 立 即 得 到 所 要 的 结论 ， 目 
定理 1.5 设 一 有 KR 了] 人手 


下 
下 又 ?一 yi 一 x AxX， 如 果 
f= 


1 Fy YE 都 服从 非 中 心 天 分 布 
2) 对 于 所 有 x， 74 D0, 
那么 和 四 互 独立 县 服从 非 中 心 姑 分 布 ， 
征明” 按 定 理 1.2 和 非 负 定 矩 阵 的 性 质 知 道 条 件 1)，2) 等 价 


于 
1》Y 234i330G 一 1 光一 17 和 39343 起 时 等 对 称 阵 。 
2Y J$A53— BB.B, 
从 而 由 引 理 1.1 可 得 出 结论 。 时 
定理 1.4 的 重要 特例 是 有 名 的 Cochran 定理 
推论 1.2 《Cochran 定理 》 


上 
设 ~ Nes Te)s yy 一 EE >) Yr 其 中 yi 于 KA XA 
[Ee 


基 对 称 阵 ，i 一 1， 那么 mn 相互 独 立 且 服从 非 中 
心 入 分 布 的 充分 必要 条 件 是 


DJ rtA) 一 所 


tal 


证 明 ”根据 定理 1.4 知道 条 件 1)，2)》 和 科 ， 人 等 价 。 因 此 
是 

y= Xxx (bp 其 中 4 一 Jp 以 及 玉 (CA) 一 kK(1) 一 
| 


£ 保证 了 yi 相互 独立 且 分 别 服 从 Xr di), ri rkC Ai), 4i 一 
MA, 反之 , 若 Pip 相互 独立 且 服 从 非 中 心 分 布 央 保 
证 


和 101i* 


于 


3) rkCAi) pp, | 


43.2 Wishart 分 布 及 其 性 质 


Wishart 分 布 是 与 多 蕊 下 态 分 布 有 着 密 芭 联系 的 重要 的 多 元 
分 布 ， 它 其 -元 统计 分 析 中 大 分 布 的 自然 排 广 。 对 于 实际 工作 
者 而 言 可 以 了 略 去 Wishart 分 布 密度 的 挫 导 过 程 ,但 关于 它 的 定义 
以 其 有 关 性 质 仍 要 求人 掌握 . 

定 尖 2.1 设 :>， 相 互 独 立 晶 服从 二 维 正 态 分 布 Ny* 
(3 
NAM eM 一 (pyrx)， 于 么 我 们 称 下 列 对 称 随 讯 绒 
阵 


4 一 了 一 > yi 3 一 《ap Jpxe 
一 


服 以 的 分 布 是 一 个 自由 度 为 # 和 pp, 非 中 心 参数 为 8 一 MM” 的 
非 中 心 Wishart 分 布 ， 记 为 A4~~ Wjtn,2 了 ,加 )， 当 避 一 0 有 时 ( 即 
yi 一 NoC0, 3)). 称 4 服 从 的 分 布 是 自由 度 为 #* 和 8 的 中 心 Wi- 
shart 分 布 。 记 为 A ~ Wn， 2)。 

类 做 于 多 元 正 态 分 布 中 的 开关 0, 这 里 当 3 不 是 正定 阵 或 者 
站 所 了 靖 时 ,我 们 称 4 服 从 的 分 布 是 奇异 的 Wishart 分 布 。 

从 定义 2.1 5 我 们 注意 到 ,虽然 了 有 也 X # 维 变数 ,但 有 4 是 对 


称 的 了 X 2 阶 矩阵 , 它 实际 上 具有 2 十 -1 维 变数 ， 因此 4 的 分 


布 洋 质 上 就 是 变数 gayas eatpyaz yo "90py 的 联合 分 
布 , 而 着 请 一 工 且 on 一 1 时 ,4 正 是 通常 的 非 中 心 好 分 布 。 

下 面 我 们 将 讨论 当 #* 守 和 > 0 条 件 下 Wishart 分 布 的 
分 布 密度 。 首 先 我 们 将 和 证明， 在 # 室 了 及 E> 0 条 件 下 A=YY 
以 概率 1 正定 ,事实 上 可 证 明 比 这 更 广泛 的 结论 ， 

引 理 2.1 设 yj 人 (i 一 1-…,#y# 守 户 )》 是 相互 独立 且 诸 yy: 服 


. 02 * 


有 从 非 退 化 型 连续 型 分 布 , 令 Y= (Cy: ~" 了) 则 A YY wn 


这 yi! 以 概率 上 正定 。 


证 明 考虑 yin "an 中 任 兰 ?个 观察 , 则 由 
PCIKC yg) 一 py) 
一 1 一 PCy1… -ys 中 至 少 有 一 个 是 其 余 了 一 1 个 的 线性 组 合 ) 
宇 1 一 访 P(y:— 2 ai 其 中 ai 是 常数 


由 于 y; 祖 互 独立 且 服 从 非 退 化 连 化 型 分 布 ， 所 以 对 于 上 一 
1 sp 有 
P (pz 一 2 Hi | Fis His its" ye) =-—= 0 


i 让 


通过 取 条 件 期 望 , 知 道 PCrkC3 yy) 一 PD) 一 1。 而 由 
1 POCrkCAY = pp) = POkCY) = p) 
> PCrk(y yo) = p)— 1. 
51 班 得 证 ，。 目 
引 | 理 22 设 y 一 《Cy 下 商 》~ 和 NC0,1,);,Z 是 1 Xn# 阶 常 
数 第 阵 且 TC2) 一 7 之 #， 则 
X= Ly 
和 A—yy— x x yl ZZ2) Ty 
福 互 独立 旦 分 别 服 从 N,(8,Z2Z) 和 Xn 一 >) 分布. 
证 上 明 记 了 一 1 一 2Z《Z2Z')"'Z 易 知 它 是 客 等 对 称 阵 ， 且 
rktP)—# 一 r, 设 t= Py,; 于 让 A 一 yy 一 1 上. 
也 第 二 章 定理 2.2 知 x 一 2y ~ N,(0,Z2Z'), 讲 木 章 定理 1.1 
知 4 ~ Xn 一 r)。 男 外 
covexst) = cow ZE，PyJ 一 了 天 一 站 
而 xf 服从 正 态 分 布 , 开 以 x,t 相互 独立 。 册 第 二 章 定理 1.3 知 
它们 的 通 数 x 和 4 也 福 互 独立 。 目 


* 103* 


定理 2.1 忆 一 《ZI ~ NoaCO0, 1 ys Ta) 这 py, 


那么 
A— ZZ 一 3 zi 
的 分 布 密度 是 由 下 式 给 绸 的 : 
(pei 二 -eroetr( 一 工 4) A>0 
其 4 一 A cf 2 ) C2,1) 


0 其 他 


其 中 ctp,n) 一 | Tt r (2 一 :十 二 , 2 8] 


证明 ”用 归纳 法 ， 当 了 二 1 时 4 ~ (x)， 它 的 密度 正 是 
(2.1) 式 中 令 了 二 1 所 得 到 的 , 即 上 节 (1.5) 式 ， 设 当 维 数 为 ?一 1 
时 定 埋 成 立 。 当 维 数 为 了 时 , 作 如 下 分 块 : 

ZN du el 
“ -( Z， )}: 4 一 人 了 
其 中 x? 是 * 维 向 量 ，Z 是 (p 一 1) Xn 阶 随 机 矩阵 4 是 
CP 一 1) Xx 《pp 一 1) 阶 仙 定 矩阵 , 量 
dn™— ZV ZV ai 一 AD， An ~™ ZZ2; 
a = 0 一 ae 一 DT — ZA ZL ZE 
由 于 _ 
HAD = fa a Ay) = Flan, a dds) * Fd) 
其 中 成 o， 后 | Aw) 是 在 A 给 定 条 件 下 en ai 的 条 件 分 布 密 
度 。 由 于 在 Aw 给 定 下 扩 anyer 一 azao7 一 1， 故 
其 4 一 fa a | 4A) A ), (2.2) 
由 归纳 法 知 ，Z; ~ Np-wnt0,1p-1,1n) 和 


KAn)}= clp—1 1 Anl dntr (— 二 An) {2.3) 


而 当 Zz; 给 定时 ,由 引 理 2.2 知道 
a 一 Za ~ NA(0, 2121) 


lm 


+ 104° 


di Xn p+ 1) 
旦 机 互 独立 ， 由 于 | 的 分 布 仪 通 过 An = Zi2, 位 焙 于 Za 从 


谭 


Kerasail4a) 一 (2m |Anl Ee err (— 1 eAzo ) 


2 
te pt 
* a err (- 二 wj) 2 ， 


。 spl 
re 人 G24) 
将 (2.37 区 2.4) 代 入 (22) 式 中 ,利用 

14| 一 | 4:| * G1:29 tr La 十 9a. 十 a A a ) 一 54 


再 比较 。 的 指数 和 2 的 指数 ， 即 可 计算 得 到 有 4 的 分 布 密 度 正 是 
(2.1) 式 。 国 

定理 2.2 设 丫 一 《yw 人) ~ NowC0, 2 1o) (> 0, 
* 宇 Pp) 那么 区 一 YY 的 密度 ( 即 了 ~ Wn,Z) 的 密度 ) 为 


ctps #)* |E (|p| -evetr (- 于 zy) V>0 


KVY~ 
0 其 他 
(2.5) 
证 明 由 于 正定 ， 存 在 33 > 0, 令 Z 一 2， 按 第 二 
章 定理 2.1 知 ，2 ~ Ngat0， Jp,，1s)， 记 4 一 ZZ '， 由 定理 2.i 
知 .A 有 和 窒 度 (2.1), 
在 (2.1) 式 作 变 次 4 一 V3 于 ， 按 第 一 音 定 理 4.3，J(4A 一 


了 一 15- 综 并 注意 到 tr 一 83 二 try 和 Ed 一 
| 了 IF 即 可 证 明 『 的 密度 是 由 (2.5) 式 给 熙 的， 重 

关于 非 中 心 到 ishart 分 布 的 分 布 密度 的 讨论 已 超出 本 书 的 
东周. 但 有 关 它 们 的 性 质 我 们 仍 要 进行 讨论 ， 

从 C2.5) 式 可 以 知 道 下 nse) 正 是 of XC9)。 

下 济 我 们 从 定 埋 2.1 导出 一 个 十 分 有 用 的 推论 。 


“ J0# + 


3 推论 2.1 令 了 是 了 FX# 阶 随机 和 矩阵 (n 宇 PP 且 IKCY) 一 
8)， 那 么 
ies 


| se 一 
于 上 7 一 


(Aad CA 0) (2.6)% 


如 
名 一 部- 一 了 十 荆 
其 中 PP( 一 )} 一 Se Sir 了 二 全 二 | 
中 (9) | ( 2 


证 明 设 Y 是 ?xX # 阶 随机 绰 阵 ,EY ~ 入 yp.e(0,7,, 了,) 那 
人 么 由 定理 21 知 4 一 YY” 有 密度 (2.1) 式 .。 男 一 方面 4 的 密度 又 
可 以 如 下 求 得 : 


jCA) 一 | HY YdY 
其 中 大 了) 是 Y 的 分 布 密度 ,从 而 
- -on (Lyy 
(A) | _ 《2r7 err ( YY’)ay 


AYYr 


= 2x) otr(— 于 4) 。 | dy 


rr 
用- 
mm c(lp,n)lA] etr( 一 十 4) 


由 于 4 以 概 六 1 正定 ，141 > 0， 所 以 
(Y= ps Al C2) 


wi 


r,($) 
利用 (2.6) 式 我 们 可 得 到 一 些 重 机 的 公式 ， 
例 2.1 求 # 维 球体 xx 一 中: 的 体积 和 它 的 表面 积 
解 ”只 须 在 (2.6) 式 中 令 p 一 1, 于 是 


好 一 中 一 】 
2 


| 了 | (A400. 用 


(3 这 时 | wwr-4dY 应 理解 为 在 作 一 对 一 变换 Y>(4, 了 ) 局 固定 4 在 了 的 恤 
域 上 壕 行 积 分 . 


a Tf 


一 2 各 
oT 3 


当 # 一 2 时 如 为 图 面积 , ”= 3 时 利用 了 了 全) 一 Vx 和 IT(p+ 


日 一 pr {py 即 可 求 得 球体 积 为 了 及。 


设 xxX 一 的 球面 面积 为 5.， 那 么 
Ts 一 | Sdr, 


将 62.7) 中 gr 下 为 27dr 立即 可 知 
2z 和 pe 

六 坚 
i 3 
当 # 一 2 时 如 为 疝 周 长 2xr，# 一 3 时 即 为 球面 表面 积 4 

例 2.2 利用 (2.6) 式 求 出 关 (n) 的 分 布 密度 

解 证 上 一 尼龙 其 中 XO— {x xray ~ NO0, 了 )， 则 
t ~ Xn。 于 是 它 的 密度 为 

有 一 | Hx)dx 一 (| 《2zx) eisdx 


$5, = 


一 1 1 (> 0) 


推论 22 设 了 x 阶 随 机 矩阵 了 的 密度 为 YY )， 又 设 


?yo7。 


VF YY 那么 六 的 密度 为 


gC(V) = a Il 和 ir) (>0) 
(三 ) 


证 明 ”直接 利用 推论 2.1 即 可 证 明 。 自 

推论 2.2 是 一 个 很 有 用 的 工具 , 它 指出 只 要 站 的 寡 度 是 忒 Y。 
zi) 形式 ,而 不 必 限 于 正 态 分 布 , 那 么 下 一 YY 的 分 布 总 可 以 求 
得 。 它 可 以 帮助 我 们 解决 多 元 统计 分 析 中 除了 正 态 分 布 以 外 其 他 
分 布 的 许多 问题 。 近 年 来 国际 上 许多 统计 学 家 和 我 国 一 些 学 者 曾 
对 椭 球 等 高 分 布 疼 进行 过 深 人 的 研究 ， 得 到 与 正太 分布 相 类 似 的 
良好 结果 。 

一 个 了 维 随 也 向 时 x， 如 果 它 的 密度 存在 且 有 形式 

‘B| igelCx 一 YE Cx — p)] 

其 中 > 0， 那 么 我 们 称 x 了 服从 2 维 椭 球 等 高 分 布 , 当 gC7) 一 
ce- 训 时 正 是 正 态 分 布 ， 当 gC1) 取 其 他 形式 时 还 可 得 到 一 些 党 
见 的 多 元 分 布 ， 对 于 这 一 类 分 布 的 平方 和 和 藉 他 有 关 的 问题 基 可 
以 利用 推论 2.2 来 处 理 ， 感 兴趣 的 读者 可 参考 文献 (22) 的 YIIL。 

下 面 我 们 研究 Wishart 分 布 的 若干 性 质 ,其 中 许多 是 闪 分 布 
性 质 的 推广 , 

定理 2.3 设 x,，**， xXx。 相互 独立 生 都 服从 NB >)， 
(2 > 04>p), 即 天 一 Ko ~ NyaCO 1521,), 令 


1 辟 1 
x— i Yx—lx.!l 
天 2 机 
本 >, 《xi — TMX 一 TY 
#4 二 1 
| XX 一 XR" 一 XK 一 1 元 是 
本 二 1 
1 。 
~ x — tl|x 
fn 


"108 + 


都 委 
~ N, (0, 二 >)， 4~ 肌 jz 一 1, 27 且 框 丈 独 鼠 ， 
证 明 令 P 是 ”xzm 阶 正 交 矩阵 , 它 的 第 一 列 为 - 工 - 1., 那 


Vn 
么 


iP 一 Cn ,0, -0). 
由 第 二 章 定理 4.1 有 
ZK OP Cn OY) ~ N.C0,3,1.) 
其 中 Y 蚌 pp Xx (sn 一 1) 阶 矩阵 朋 与 9 无关, 而 人 OX 一 Vn ,一 
一 [PP| 到 一 1 作 变 换 六 一 Z 并 注意 到 
(KX— OLUNX— OY ni — ONMNx— YYY 
从 X 的 密度 表达 式 可 求 出 VY rn 和 Y 的 联合 分 布 密度 为 
Qlzl ot {— Lat Vn0) 
na 十 YY 
由 此 可 知 


AM NA 0,3), 
y ~ Nps-iC0s 2, 11) 
县 和 相互 独立 ， 而 
A XX — nx XX— OLY 
nt 0NE— Y= YY 
按 定理 2.1 知 4 一 分,(n -1,3)。 由 第 二 章 定 理 1.3 知 至 与 4 


独立 。 而 =~ Ns (9， 小) 是 显然 的 。 四 


注意 到 8 一 一 -一 4 正 是 通常 样 木 协 方差 矩 陈 ， 又 由 “> 


一 1 


* I09 * 


所 忆 # 一 1 尝 p 保 证 了 4 以 概率 1 正定 ， 而 这 正 是 通常 样本 
渔 值 向 其， 


下 面 | 


国 
RE 


当 4 ~,Cn;,， 昌 》 时 4 的 相应 子 短 降 的 按 绿 分 
布 。 
定理 24 设 4~ 玉 ,Cr,3, 避 ) 且 4 有 划分 
A A En Zn A D1 

4 (2) ss) ?~ (oo 
黄 中 Ai 是 4 阶 方 阵 (1 所 4 所 2) 而 3125 为 相应 分 忒 征 阵 ， 
那么 

‘uy ~ Wn Zu On), 

征明 由 于 4 ~ 斑 ,(n,5 ,8), 按 定义 存在 PX *# 阶 戎 机 短 

阵 了 一 有 使 得 4 二 了 YY, 其 中 一 MM', 


记 了 一 (y ,其 中 为 4 xz 阶 矩 阵 。 那 么 按 第 二 章 扒 


Mi 
沦 21 知 Yi~ Noa(Mis241o)， 其 中 MM 一 (0) Mi 是 9 x 
# 阶 滤 阵 
由 于 Au 二 * Yi 从 而 4 一 了 (zi 一 对 Wi。 | 
定理 2.5 设 和 ~ LP 4 一 (4) 一 C01)s 其 
丸 
中 4 为 节 X 下 阶 定 阵 《1 了 人 >， 4 一 ,js0# 是 


| 
相应 的 分 块 短 阵 , 则 
Aii ~ La 

证 明证 法 与 定理 2.4 相仿 ,只 是 令 4 一 YY， 其 中 了 ~ 
NM ED 以 及 Y= (Yi, 7 
3i31.)，。 所 以 

A ™ YiY: ~ Li 瑟 证 全 0 一 MMi:. 国 

推论 23 设 4~ 玉 ,Cn;,Z,8)， 其 中 3 一 (04))9 二 (wa)， 

4 一 《Cas) 部 是 了 XxX 了 阶 滤 阵 ,那么 


11i0* 


di ~ TR (> ex ). 


Oi 
如 果 2 一/,， 那 来 m1 相互 独立 且 服 从 (Cn, on 
证 其 任 给 读 省 ， 
定 记 26 设 4 WR) p> 0， 以 及 
La A Zn Fl 
“47 (人 py 2 一 ( 本 
其 中 A 是 了 XXX r 阶 知 阵 ， An 是 5 X1Y 阶 和 矩阵 ， rts = 疡 ， 马 让 
为 相应 的 分 块 ， 并 记 A A AAsda, Bi Lu By 
”1 一 区 22， 那 末 
1) A 一 Wn 一 13 了 1 且 与 (CA, La) 相互 名 杠 。 
2) 给 定 4 后 A ~ NP A, Pr 
3) La ~ Wn, Za) 
“证 职 在 有 4 的 密度 表达 式 《2.5) 中 作 变 换 Ai，A1:，A2 一 
5 4 由 第 一 资 定理 4.1 知 了 一 天 4 dy Ay Ai 


2 好 a) 一 1 ， 利用 


4 (7 人 0 )( I ， 
必 f{ 0 A sit i 


pt ( 1 °C 0 }(! 2 
一 互生 和 了 [由 pp 0 i 


经 过 简单 计算 可 得 
$7 0 了 一 了 Ad 
oa 
0 pp 0 i 0 了 


A Ud I 0D 1 0 
(0 gaa De 1) 
m= tIL Br Er A — BPA) Ant A 
一 BA2) 十 三， 
代入 人 (2.5) 式 之 中 并 情 以 了 得 到 Ai zy: 的 联合 密度 为 
slll» 


和 


Ly. A ) fC A) ft | .42) 上 (La 
其 中 


h—s#—r—l 


CA 一 ca 了 | A 1 etr 
。 (— Za) 
FC A An) — cl Esl | Ai Zetr 


。 | 二 Ed 一 BAnY A 一 pda 


rt—#--l 


fl A) = cal Ba| 7| A 1 elr (— 地 ztAs) 


这 里 各 c; Ci 一 1,2,3) 分 别 是 规范 已 常数 ,使 得 密度 在 定义 域 上 
积分 为 1。 由 因子 分 解 定理 知道 
AA) 独立 ， 
dz A ~ N.CBAn, B13 Am) 
A» ~ Wn, Sn). 
定理 得 证 。 用 
定理 2.7 设 4~W(n,3,0) 了 >0,n>p，B 为 mxp 
辽 续 阵 且 rk(8) 一 w， 则 
BAB’ ~ Wal#s BEB’, BOB’)., 
证 明 由 于 A4~ 玉 nn,2, 恒 >， 存在 Y 了 ~ NpaCM ,7,1.)， 
避 一 MM， 使 得 4 一 了 YY’, 而 
BY ~ NeaeCcBM,BIB', 1,) 
所 以 按 定 尽 有 
局 .4 -= BY * (BYY ~ Wn,BEB ,BOB),. 国 
推论 24 设 4 ~ 下 (wn, 名 》， 则 有 4 的 任何 二 次 型 
EA ~ oir'tns 2) 
其 中 为 了 维 向 量 , of 一 Fl， 1 一 loi, 
而 当 A~ WA E) HH, {A ~ olin), 


"Ili2* 


证 明 留 给 读 者 。 

定理 和 28 设 丰 ~ 入 ,M,Z,J0(Z 六 0),1 是 了 弘 非 翟 向 
是 ,BP 是 XX 六 阶 对 称 知 际 、IkK(B) 一 4, 太空 4 之 pp， 那 么 

A 一 BN ~ Li 0) 

的 充分 必要 条 件 是 

对 于 上 述 任 一 非 地 向 最 上， 有 

Al ~ otiCn, dy) 

其 中 只 一 MBM' ,oi = P21, i= Iolol, 

证 骨 必要 性 由 定理 2.7 得 到 , 若 4 一 XBX ~ W(tn， 了 3， 
OY), WHA ~ on ,1). 

充分 性 ; 

由 于 XE ~ NM ol). BR CTXYBCXTY ~ oICn, 
4)， 由 定理 1.2 知 B 蚌 对 称 颖 笔 阵 , 朋 rkC8) 一 x， 于 是 由 第 一 
章 定 理 3.2 知道 在 在 x ?和 矩阵 ， 使 得 B= UU 有 VU. 
因此 由 第 二 章 定理 4.1 知 

KU ~ No MU,E ,1,.) 
因此 
XBX CXUY (XUY ~ Wn,23,0) 其 中 0 一 MBM’, 

时 外 由 于 91 一 0 对 一 邯 非 零 癌 是 站 成 立 等 价 于 8 一 0， 
所 A~ WK#，》 的 充分 必要 和 条件 是 对 任 一 非 零 向 量 有 
CXBXRYN ~ on) ,nm— kB). 量 

推论 2.5 设 针 ~~ NpsCM;B,1o)， CC 是 x X# 阶 对 称 矩 阵 ， 


而 
1) XCX ~ Wr ,2) 的 充分 必要 条 件 是 
Ca 一 Cr 一 rkCG) ~ MCM', 
2) 天 CX ~ Wkr, 也 ) 的 充分 必要 条 件 是 
C0, rtktC), RC = 0, 
证 明 ”二 定理 2.8, 定 理 1.2, 立 即 可 得 。 量 
定理 2.9 设 ~ NCM,3,1,XKn 守 p20),.C! 和 C， 


9 {3. 


是 两 个 # x # 阶 对 称 窜 等 矩阵 ,网 XCX 和 XC:R 相互 独 亦 他 
充分 必要 和 条件 是 CCs 一 0。 

证 明 ”必要 福 : 如果 CX 和 XCsX 相互 独立 ,网 外 第 二 
章 定 理 1.3 知 对 任 一 捕 维 向 虹 【六 KG 有 XCXN 也 相互 
独立 ,性 于 XH ~ NCMT， oj.)， 所 以 由 定理 1.3 知 CC 一 
0。 


充分 性 : 车 CC: 一 0 由 第 二 章 定 理 42 知 XC， 和 XC， 
相互 独立 ， 从 而 它们 各 自 可 测 函 数 〈(XCDCREG 一 XC,X 和 
《CXCXXCsY 一 XCX 技 第 二 章 定 理 1.3 也 六 互 独 立 。 英 

定理 2.10 设 ~ NCM,E,N) (np D> 0),C, 


Ej 


Ci 是 * x # 阶 对 称 矩 降 .。C 一 Ci ri 一 zkCC) rr 一 Ik(C)， 


那么 下 列 四 个 条 件 中 
1) Ci ts 是 突 等 阵 
2) Ci C0 Gj,iol, 
3) C 是 帘 等 阵 


Yr 


当 1),2),3》 中 有 两 个 成 立 或 者 3),4) 同时 成 立时 都 三 如 下 的 结 
论 : 

3) KOCX ~ W ,ri 2, 92) 其 中 Oi 一 MCiM (i 1 
开 )。 

by {XOX i 一 1 相互 独立 - 


c) KCX ~ Woolr 20) 其 中 号 一 MCAMr 一 人 ri 


证 明 由 引 理 1.2 知道 上 述 四 个 条 件 当 1),22,3) 中 企 两 个 或 
者 37,47 同 时 成 立时 ,四 个 莹 件 癌 了 时 成 立 . 于 是 由 推论 2.5 和 定理 
2.9 可 推出 a),c),b》, 时 


-114， 


| 


上 上 国 


+ 
i 


DD 


推论 2.6 【条 元 Cochran 公理 》 
二 

设 ~ Np CM, ls 1) 2 py 4 一 下 | 4 其 中 44 一 
imy 


XBX, B, 是 i # 阶 对 称 窟 阵 {二 1l,+: " 那 笃 A 相互 独 
立 且 服 及 非 中 心 Wishart 分 布 的 充分 必要 条 件 是 


> rkCB:) = #, (2.8) 


证 明 ”在 定理 2.10 中 取 Ci 一 BC 一 了 人 一 1 有)。 出 
由 于 1。 显然 赛 等 的 ,由 (2.8) 式 知 条 件 37)，4? 成 立 , 从 而 推论 成 
立 , 反 之 是 显然 的 , 留 给 读者 证 明 。 重 

从 上 述 诸 定理 可 以 看 到 Wishart 分 布 的 许多 性 质 完全 是 j 
分 布 的 性 质 的 多 维 推 广 ， 改 在 此 不 一 一 列 员 例如 与 定理 1.5 入 
应 的 性 质 读者 可 自行 写 出 . 

下 面 我 们 求 出 4 ~ 玉 ,(n, 了) 的 特征 函数 ,注意 到 此 时 它 对 
# 和 不 再 有 7# 安 ?和 之 0 的 限制 ， 也 就 是 说 即使 女 是 琳 异 的 


Wishart 分 布 时 也 同样 成 立 . 


定理 2.11 设 4~ WKn,3)， 那么 4 的 特征 装 数 是 
pAT) = 1 — E71 C2.9) 


在 定理 2.11 证 明 前 , 我 们 先 作 加 下 说 明 ; 由 于 4 中 随机 变数 
仅 为 上 三 角 扎 阵 元 衰 Gs “381p3 人 723 "ys Fp" Uppy 俯 而 它 的 


特征 玖 数 应 该 是 和 exp( i 了 > awtw】》， 然 而 这 样 处 理 有 所 本 
二 二 1 二 天 
便 ， 我 们 将 记 7 = (wy) 是 一 了 XP 阶 对 称 短 阵 ,以 Eletr 


GT 一 了 op 人 2 如 ownw 外 作为 4 的 特征 函数 ,请 记 信 


示 时 了 的 特征 殉 效 是 dnsdop3 "2prd3" "rps "3 Upp 的 
特征 函数 。 
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“证明 设 44~ 玉 pn 如)，rk(3) 一 +， 按 定义 存在 YY 一 
《3 ye ~ No 0, SE,T,), 侍 得 .一 了 *Y。 即 诸 yi 相互 独 
立 且 服从 一 Wi;C0, 互 )， 按 第 二 章 正 态 分 布 定义 ， 可 将 yi 表示 为 
yi 一 Bx;， 其 中 2 相 豆 独立 上 且 服从 NC0,1,), 而 B 是 xr 阶 
眠 阵 且 ~8F 一 了 且 江 (8) 一 +，。 于 是 4 的 特征 函数 可 表示 
为 : 

对 于 产 X 产 阶 对 称 第 隆 了 一 《rm 

pa T= EletriT’ A) 
一 EletrCGiY’TY)] 


=— Elexp(lizB’TBZ;] 

由 本 章 C1.15) 式 知 2z18' 了 Bz 的 灶 征 图 数 是 
I, 一 2izB'TB|-$ 

令 f 一 1 上 且 利 用 第 一 华 推 论 2.3。 有 

HH, — 2iB'’TB|I = |1, ~— 2i3T| 


因此 
waT)= TT 1 — 2iB'TBI- 
一 1 一 22371 7。 图 
下 面 不 加 证 明 给 出 非 中 心 Wishart 分 布 的 特征 函数 。 
psTI = |1, — WET) ietrtiTO, ~ 2iZT)'0] 
(2.10) 
| 定理 2.13 设 Ai ~ Htnis 2, Qj;) 《一 下 且 它 们 
相 豆 独立 , 那 女 
* 
4 一 DH) Ai~ Welns 5,0) 


轩 
其 中 ry D2 


f= j=l 


+ 了 三 


狂 明 从 定理 2.12 知道 .4 的 特征 函数 是 
OKT) 一 | 一 2843T1- 了 etrfiT( 一 2337)9j] 


开 
而 4A; 相互 独立 ;所 以 4 一 > 4 的 特征 阴 数 为 
i=1 


此 | 
waT) = [T Ppa) Ns AET| YeurtiTO, 
i=l 


一 21ET) 10], 
即 A~Woln,2.0),， 
| 为 了 进一步 理解 Wishart 分 和布, 我 们 设 A ~ 钱 (#,1), nn 之 
pz， 于 是 4 概率 为 1 正定 。 按 第 一 章 定理 3.12, 知 它 有 唯一 的 三 角 
分 解 , 即 


A=— TT 
其 中 全 是 下 三 角 和 矩阵 且 > 0G 一 1,-…,p)， 那么 有 
定理 2.14 设 4~ 邢 (sw 1p)n 守 2)， A 一 TT', 其 中 
T= Cry) 是 下 三 角 和 矩阵 且 和 > 0Ci= 1020， 出 所 有 31 
i 扣 j 所 Pp) 都 箱 互 独立 , 且 
一 NEO 1 全 和 
ni im 1,---,p) 
证 明 见 本 章 附 录 。 
定理 2.15 设 A4~ 玉 wns) (wn 守 p)， 那么 


141 一 nh Hs 
其 中 一 X88 一 1 了 十 1) 且 相 王 独 立 。 
证 明 从 定理 2.14 立即 可 知 |4| 一 [[ 总 且 


el 
一 一 1 十 1) 且 相互 独立 ， 定理 立 即 得 证 ， 旱 
附注 ， 本 定 娃 也 可 如 下 证 明 ( 不 利用 定理 2.14); . 
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设 


A a 


A Opp 
4]|。， 由 定理 2.6 知 go 一 上 ~ Wz 一 了 十 1,1), 革 
Xn 一 十 1) 旦 与 如一 且 pa 1 独立， 同班 将 A 进行 


划分 。 可 知 144 一 开 上 其 中 同一 Ra 一 1 二 1) 且 相 互 独 
立 . 
推论 2.7 设 W 必 WCn,2),#n 之 p> 0 则 


EE 
Iwl= [31 Tl# 
是 


其 中 z 相互 独立 有 ~ YCw 一 语 十 1》 

证 明 由 下 和 ~W,(n,3),3>0, np， 知 了 二 存在 ,于 
是 令 4 一 3 二 本 323， 按 定 玛 2.7 有 4 ~ 开 ,(#,1,)， 由 此 可 知 ， 
| 本 | 一 |21|41， 利 用 定 丙 2.15 推 得 结论 ， 量 


4 3.3 Hotelling T* 统计 量 和 Wilks 4 
统计 景 的 分 布 


在 本 音 我 们 将 介绍 另 两 个 重要 的 多 元 分 布 , 即 Hotelling TT? 
统计 量 和 Wilks 4 统计 量 的 分 布 ,前 者 可 看 成 是 分布 的 多 元 推 
广 , 而 后 省 与 分 布 有 着 窗 切 的 关系 . 

定义 31 设 A~WAn3Ns 守 p30) 和 y ~ NAR，, 
3) 相互 独立 , 则 称 

了 py Ay 
为 县 有 自由 度 了 各. 的 Hotelling 了 变量 

7: 统计 量 是 再 oteVing 最 早 在 讨论 多 元 正太 分 布 的 期 望 向 
量 的 检验 时 提出 来 的 (我 们 将 在 第 四 章 中 进行 讨论 ) 故 称 为 Hote- 
liiag 7? 统计 量 、 下 面 我 们 首先 导出 它 的 分 布 ， 


* ig a 


定理 3.1 
Pt 7 
P 让 
| 


yAYy~ Flpsn— pt 1,2) 


其 中 2 一 W271p. 
证 明 出 A4~W(ns3), yy ~ Notp;3),F>0,4 汪 及 
引 理 2.1 知道 4 去 三 率 为 1 存在 , 作 下 询 变 痪 
互 一 五 ay 
全 一 7 3342 
其 中 了 去 是 3 的 对 称 平方 根 , 于 是 所 ~ NC3- 引 ,1 ~ 
Wn,1s) 且 
Jr 一 和 本 
设 ? 是 一 个 随机 正 交 答 阵 , 它 的 最 后 一 行为 (zz) zx 令 
下 一 Pz (0 0 CHE)), Wr PHP'. 
从 而 当 P 了 给 定 后 印 * 的 条 件 分 布 仍 为 万,(#, 1,)， 它 与 P 无 关 ， 
即 斑 * 的 无 条 件 分 布 仍 为 玉 plx,1p》 且 与 z 独立 ， 因 此 
一 4 一 
记 礁 守 
W* 一 人 WI ) 和 WT Ct) 


bE 
Ww/] Wpp 


由 第 一 章 定理 2.1 和 本 章 定理 2.6 知 
CO) wp wp 十 1) 仍 和 5 可 
互 独 了 并。 于 是 | 上 


0 

7 oe ot : 

2 -一 ss . 
nCO, 0,V Za wea 1 0 
Mx 


i FE 
ee 
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由 于 wz ~ Cp， WERY 与 (Co! 相互 独立 , 按 FE 分 布 定 义 逢 
TPITLT pp,n— pt 1,1) 
Pp 大 . 
| 
定理 3.2 设 %, wx。 是 从 正 态 总 体 用 ,Ka ) 中 独立 抽 
取 的 容量 为 * 的 洋 本 〔* > p,3 这 0)， 那么 
T? 一 nl# — 1 二 < 
服从 自由 度 为 P 和 #* 一 1 的 Hotelling T?* 分 布 ,从 而 
了 T! 
pp ni 


~ Flpyn 一 ps4) 


鞭 中 2 一 了 x, 4 BD) (2) 一 2), np 
证 明 根据 定理 2.3 知 道 ~ N, (jp, 2)，A4~ Wn 一 


1,) 且 它们 相互 独立 ,从 而 W #x ~ N, 《VY np,23), 按 T? 统计 
量 的 定义 以 及 定 召 3.1 立即 得 到 所 要 的 结论 。 | 

在 定理 3.2 中 令 pg 一 1， 见 7T? 统计 量 正 是 通常 一 元 绕 计 中 
+ 统计 量 的 平方 ， 

定义 32 设 A~ W(tn,3NE > On p), B~W(l, 23). 
有 旦 4 与 8 相互 独立 , 则 我 们 称 随机 变量 

A 4 
j4+B| 

为 Wilks 4 变量 , 它 服 从 的 分 布 记 为 4Cpsmy 门 ， 

注 在 定义 3.2 中 要 求 了 >>0 和 站 之 产 以 保证 4 概率 为 1 正 
定 ,市 对! 没有 i 守卫 的 要 求 , 当 = 二 1 有 时 它 正 是 一 元 统计 中 的 
分 布 , 它 最 早 是 Wilks 提出 的 。 当 之 3 时 4Cp,#, 上 ) 的 精确 分 
布 的 密度 表达 式 基 很 复杂 的 ， 

引 理 31 如 果 1p)i 一 1,2-…} 是 一 实数 序列 ,满足 


ed _J 
2) pt 


[A 


* I20 + 


是 发 散 的 那么 只 有 一 个 分 布 具有 窍 序列 {ml， 这 引 理 又 称 为 
Carleman 引 理 ,我 们 将 示 加 证 明 地 予以 引用 ， 

设 让 ~ ACP5 和 oD) 则 0 才 A 生 10 和 EA 一 点 所 1， 显然 
满足 这 个 引 理 ， 从 而 它 的 各 阶 矩 唯一 定 田 了 4 的 分 布 ， 通 过 计算 
下 的 睛 阶 算 我 们 可 以 证 明 以 下 定理 . 

定理 33 ACyp,n,1) 的 分 布 正 是 由 PP 个 相互 独立 日 依次 服 欠 


参数 为 二 Ca 一 ;十 1)， 1 的 8 分 布 的 随机 变数 的 乘积 所 服从 


的 分 布 《一 1,:**,p), 
证 明 见 本 童 附 录 . 
定理 3.4 ACp, zs 有 ) 和 4Clyn -Fi 一 pp) 服从 相同 的 分 


布 ， 

证 明 见 水 章 附 录 ， 

利用 定理 3.3 和 3.4 我 们 可 以 求 出 当 pg 一 1,2 或 1 一 1,2 时 
ACps#,4》 的 确 夸 分布 . 


1) 沼 p 一 1 时 ，AC1sm5 有 ) ~ (了 地) 于 是 由 (1.14) 式 


知道 
1 AnD pe,n) (3.2) 
i ACl,n,l) 2 
从 定理 3.4 知 当 二 1 时 
n+l1—p1l— Ap,n,1) 
? ACpsnsl) - 
p+il—Atl,s— pitl,p) 
Fa 4CL 一 声 十 1, 7) 
~ Fp pitl)” C3.3) 


2) 当 p=—2 时 ， AC2,n,4) Sn Rig 其 中 TL 8 (二) 


~ a(® = 1, 三 县 相互 独 衬 , 于 是 利用 (1.11) 式 


+ 2 " 


EAs(2,n,D) — Ex! . Ex 
| anit+1 Iv 
并 二 有 iT (Ti + 二) 


i ‘T(t (i+ 十 荆 十 全 
2 a 2 7 


利用 了 函数 的 倍 值 公式 r( 十 十) FCr 1 2 RT (2 


十 1》 可 得 到 
ne Fe 一 1 十 2pDITC8 十 了 一 1 
EA'C2,n, 站 rz — ra 二 7 一 1 十 2) 
= E[Cy*Y*] | 129° >) 

其 中 ?~ Bs 一 1 人 )， 由 引 理 3.1 知 V 4(2,45,1) 与 8(n 一 1, 7) 
有 相同 分 布 , 于 是 有 

nll—VACGnD). PC212(2 一 1 (3.4) 

i VAC nl) 

类 似 地 当 了 一 2 时 有 


”Pl V ACpsn, 2) ~ Fl2p,2(n—p)) (3.5) 
! Alp, n,2) 

关于 p 一 1,2 或 者 1 ~ 1,2 时 4 的 分 布 与 分布 的 关系 由 
表 (3.1) 式 给 贡 。 

正 妆 下 分 布 对 于 一 元 方差 分 析 和 回归 分 析 十 分 有 用 一 样 ，4 
统计 量 的 分 布 对 于 多 元 方差 分 析 和 回归 分 析 也 是 十 分 重要 的 . 关 
于 ALp,#,1) 对 应 于 显著 水 平 0 的 临界 值 A 已 经 由 前 人 造成 表 
格 ,读者 在 使 用 时 可 参考 文献 [19] 的 书 未 。 有 了 时 为 了 方便 ， 当 4 斋 
分 太 的 时 候 我 们 也 可 利用 它 的 渐 近 分 布 求 出 交界 域 ， 我 们 不 加 证 
骨 给 出 下 面 定理 . 

定理 35 设 4~ 4Cp,#, 人 站 则 当 # 一 co 时 

—rinA ~ Xp 站 (3.6) 


和 122 站 


其 中 > 一 一 半 Cp 一 1 十 1)， 当 # 不 太 大 时 则 有 


Pl—riaAs) = POCPD < 2) + TIPECp! + 4) 
rT 


< x) 一 PORICPIDD < #2)] + of ny) C3.7) 
其 中 rn 一 Cp 一 i+ Dy = pillp’ + 1 — 5)16. 
此 定理 是 Bex(1949》 给 出 的 ,读者 可 和 根据 显著 水 平 < 和 的 
大 小 从 六 表 中 找到 相应 的 临界 慎 4。。 


关于 Wilks 4 绕 计 量 的 渐 近 分 布 还 有 一 些 其 他 结果 ,我 们 不 
一 一 给 出 了 ,有 兴趣 的 读者 可 参考 文献 !6]1. 


于 3.1 psns 了 站 与 让 的 关系 (n>p) 


好 限 从 王 的 统计 最 . 自由 度 
任意 1 | 半生 1 4 (pn—p+1) 
任意 2 2 lA (2p32(n — p)) 

1 任意 F 二 (14) 

2 任意 二 了 44 | (C2028 — LY 

习 题 三 


站 ,1 设 Pi (Ci ~ N, Chl ci lg) 且 囊 互 独 
立 ; 其 中 1 是 元 索 全 为 1 的 六 维 列 向 量 * 记 


了 233 


Hl 二 LE 
! 
其 中 yD 
1 j=l -1 iml 


证 明 1) WW=E+8 且 多 一 如 人 一 1 

2) En 一 天)o62( 才 -1) 旧 它 们 相互 独 交 。 
提示 : 利用 习题 一 中 第 8 题 的 结论 
3.2 设 天 一 《xy wNief0o)s。 其 中 xy 是 了 维 涌 机 向 量 ， 询 

lp plp 
“一 tw ip ) 

证 明 1 jo| 所 1、 当 且 仅 当 lp]1<1 时 # 是 非 奇 异 分 布 

2) 令 吕 一 一 个 功 ” 3 则 

由 一 站 81 一 0 和 (一 1 {pl<1) 
提示 ; 首先 车 虑 y 给 定时 w 的 条 件 分 布 ， 然 后 说 因 它 也 是 无 条 件 分 


3.3 设 syrw 拒 开业 立 且 服从 NO0,0*)、。 证 明 
Ce > > {zi CO— Xi = 之 
i=1 tel = 

相 拟 锤 立 * 且 求 出 ”的 分 布 。 

提示 ; 设 = = 一 (rsxze) 说 有 明 a 可 以 霄 示 为 x 的 二 次 型 w=x dx， 
且 4 是 军 等 对 称 阵 ， | 

3.4 已 向 A4~Wp(C#y 人 2)， 记 村 二 Canj)，Z5 二 《914)。 证 上 明 

1) EA4= #5 - . . 

2) Ediidr = MOO + HTNTj + TFT) 

3) Elaii — Hi) (Car — WTA) = nO 二 四 和 他 让 

4) Etaif ~ HO) = #0 + Tia0ii) 

提示 : 利用 习题 二 第 4 赴 的 结论 ， 

3.5 设 
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A (人 2) rp C 区 
一 人 
A da 


了 有， 
于 一 0 2 )>。 (np) 
其 中 4， 是 rf x "rr 阶 算 隆 ， 届 ;是 1 x rr 阶 算 阵 且 车 二 Cr 开 们 了 是 
相应 分 块 。 证 功 : 

P= ad BS 《4 4) 相互 独立 。 

提示 利用 第 三 章 定理 2.6， 

*3.5 窗 元 上 分 布 具有 密谋 

fx) = 0 [EE 4 ps 一 本 可 ER 

利用 推论 2,1 求 再 常数 。， 

*3.7 设 4 是 一 个 ?xx 证 阶 对 称 随 机 纸 阵 * 如 果 它 的 扳 率 密度 是 由 下 式 
给 出 的 


eV | 14l eer (一 十 va!) 4 正定 时 
(4) = 2 
0 其 他 
pip—t) 志 1! 
其 中 一 | ( 下 r (二 了 = 一角 《72 和 是 让 关 也 


iel 


阶 正 定 紫 阵 , 则 称 4 服从 自由 认为 入, 和 参数 算 阵 为 的 道 Wishart 分 布 : 并 
记 为 4 一 CNJV)， 斌 证 ， 轨 8 了 时 ;网 SPMN 二 七 1 
下 

提示 ， 利 用 第 一 章 定型 4. 中 TCF 一 ) 的 结论 。 

*3,9 设 WW 一 Wm 一 pr 
证 明 : 2 一 yp， 的 分 布 密度 为 

so. [2 让 7 十 也 | 下 

并 求 出 常数 。。 并 说 明 为 秆 又 当 山 j 一 让, 人 Cas E17 时 不 能 得 出 以 上 结 
论 。 

提示 ; 剩 用 JWisWy29W) 一 | 且 于 二 中 

#3.10 已 知 X 是 了 x * 阶 随机 扰 阵 。([a 基 的 ， 且 它 的 蜜 凑 为 


HX 1xx'lrers( 一 二 xx) Cr 常 郑 ) 


了 2。 


求 3 一 XX' 的 密度 函数 ， 并 求 出 常数 “。 
提示 ， 利 用 推论 1.2。 
*3.11 设 XNe,atM, Ey VY Yi XAX Gm lyn ks Y= 


X4X 二 六 /Yi 医 
i=l 


1) 了 ,YserrygYAt 者 服从 非 中 心 Wishart 分 布 ， 
2) 对 所 有 X,Y 0, 

证 角 了 .ryYs 都 相 下 独立 且 服 从 非 中 心 Wishart 分 布 。 
担 示 : 利用 第 三 章 引 型 1.1。 


附 录 


《一 引 理 1.2 的 证 明 
1 由 条 性 ;2) 推 出 条 人 性 3),)。 
由 4 罕 等 和 di 4j 一 0 [和 1 一 1:5) 知道 


4-( 立 /4 ) = =- 守 + 避 4 


=l i El imt 
因此 4 军 等 ， 另 外 
上 此 
p= rktAY 一 trd 一 “(> 人 = Sd) 
j= sl 


= Sec 一 Dir. 


iml 


2) 由 条 件 1)*3) 推 出 条 件 2). 
由 4 及 4 等 等 ,知道 A 是 非 贷 定 阵 ,因此 存在 矩阵 8 使 得 A 8B'， 
由 引 理 1,1 立即 可 得 2): 有 :人 一 0 Ci = 1 RD), 
3》 由 条 件 2) :3 推出 条 件 0 
由 Ai* Ai 一 0 人 下 4 竺 等 , 知 
A = AiA = di oo i, 


和 0 
-Gs ac- 1 ) 


及 因为 
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i rd — + kA = kA) + rd 一 才 )》 
而 KEC 人) 一 了 EA 信人 上 式 , 得 到 
kA — AY 0, 
即 五 成 立 。 
4) 外 和 荣 件 3), 匀 推出 条 件 .1). 
由 于 4 考 等 ; 知 痢 存 在 正 交 阵 了 使 得 
P'AP = 人; 】 


记 


其 
[3 
(00) = (0) GD 
由 天 一 p22 风 及 p= i 得 到 


‘ 4 
p= rls) > rkCDi) SS 了 TEA 一 > 让 
i=1 


irt To 
所 向 ri rk( Di) = rt A, 
下 面 证 遇 2， 是 径 等 阵 .由 DP 对 称 ,存在 正 交 阵 2 使 得 
号 DO 一 diagfhyear y 各 :ss 


于 是 
天 
ly oo diagtAhiy rds see OY 十 > gDg 
[EE 
因此 
1— A 
“ 1 一 A 上 
rk 1 < 之 :ODO 


~ 
1 


w= > rn ph 


f= 
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必 有 和 一 人 和 mi 于 是 D 是 等 等 对 称 阵 ， 类 做 可 以 证 明 Di(i = 
3) 也 是 便 等 矩阵 。 
最 后 证 明 Gt = 0, Fy 一 0。 出 于 
D;: F, 
x( c) rk(CDi)y 
存在 短 阵 T 司 得 
CFiy GD = TCD;, Pi 
二 
所 以。 GTR 一 7DiT'>0。 但 从 (1) 式 知 六 Gi = 0， 推 得 G = 0(i = 
ji 
lh), KO~ Gr = ThiT’ = (CTDIYCTD,Y 
即 Fi 二 7D; 一 0 (二 1,-… 人 )。 最 后 推 得 


or ) 
是 军 等 阵 , 折 以 条 件 1) 成 立 。 是 


二) 定理 2.14 的 证 明 . 
出 于 : A~—Wetns Tr) np), 4 有 密度 


HA) = elpsn) |4| er 人 (一 4 (2) 
其 中 ep 一 | 2 rs 全) ， 
rs (2) = <" TF 下 (2 (3 


作 变 换 4 一 YY， 其 中 了 是 对 角 元 素 为 正 的 下 三 角 和 矩阵， 按 第 一 章 定 
理 4,.4 侣 


NAT) = 27» TE s+ 
代 大 C2) 式 ,得 到 了 的 密度 为 


fCTY) = cfpsm) 。2p。 下 seit! (下 mn 


i=l 


[二 


i=l i 
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虹 丁 了 分解 定 建 知道 所 有 1 之 j 扎 ?) 相互 独立 昌 fT) 可 写成 
KD = TT -se(- 荆 二 


arerap 2 区 
Pp 一 十 
和 一 一 
i (st 
2 
1 i) 
和 尾 下 ~ 
r{ 2 《47 


部 拜 一 各 Ka 一 十 1 人 一 op) 必用 1 一 NT01ICLS ji 人 。 四 
《三 ) 定型 3,3 的 证 明 
我 们 只 须 证 明 4~A4(pyn,1) 的 二 阶 宅 恰 等 于 声 个 独立 县 服 以 


| (< +， pn Ci ys py 


的 随机 变数 对 积 的 4 险工 娶 可 . 
窒 易 证 卓 4 的 分 布 与 无 闫 ;不 姑 设 A4~Wotnylp) 和 Pt 县 
相互 独立 ，# 突 pg。 于 是 Bw YY 其 中 
YNput0pipyti) 且 与 4 相互 狂 立 。 
于 是 《4sY7 的 联合 密度 为 
CdsYY = Cpsny* 14al C2 er |- 圭 【4 十 rr (53) 


因此 
BA | PIOPESLA GR 
Hy ct py) f -| - 

rey) | iA4 + YY | 一 ee pa 全 十 24) 


Be pl hn Lm] 


a 全 


。 et [= + rr)] .aar 


注意 到 积分 号 下 可 看 成 4~wpts + 28s17) YY' 一 Bre,1s). 且 相 互 独 立 ; 则 
此 时 B44 可 借助 于 E16|~* 得 璋 .页 


_ _ _, | 四 二 下 一 一! 
so = [le eon 25 4 DG 


a gtr (去 0)46 
四 2 


了 了 28 


~ tt Do 7 


时 机 苯 二 | 


» tf (到 °) jG 
2 


reps 十 2 下 十 1) 


spn+ i 
于 是 
"+ 
mr (二 (2 二 和 + 
人 
ED 
这 是 将 C3) 式 代 人 后 计算 出 来 的 。 


(6) 


污 本 音 C1.11) 式 知 ; 落 二 8([ 世 二 了 人 | 时 , 它 的 阶 算 正 是 (C6) 
之 


2 


式 中 的 一 个 因子 ;而 * 相互 猎 立 * 则 它们 霓 积 的 上 阶 算 正 是 各 个 变数 4 阶 矩 


的 业 积 ;从 而 定理 得 证 。 帅 
(四 ) 定理 3.4 的 证 明 


设 do AKCbymolJo alti, # 二 一 pF， p)s 要 让 它们 具有 想 闻 的 分 


布 * 只 须 迹 阴 Ed} = Ed (he 133.0 ) 凤 ] 可 
当 1 筷 P 时 Cp 可 类 侈 证 明 2， 出 于 


"(9 
", 站 
人 


® 10" 


从 而 


出 (6) 式 知 


nD rE) ” 


"(3 
Se) 

于 上 天 一 如 
Ce 


r(t er, 二 + 


将 CD 趟 代入 (99 式 ; 并 用 = 十 站 代替 w, 即 得 Ed 一 E43。 四 
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第 四 章 “多 元 正 态 分 布 参数 的 估计 


荐 z 维 诅 机 向 量 x ~ wii ， 23)， 那 么 它 的 分 布 密度 完全 由 
它 的 期 望 向 量 pg 和 协 方差 矩阵 所 决定 。 因而 当 已 知 某 一 随机 
向 量 服 从 正 态 分 布 时 ， 如 何 通 过 抽取 的 随机 样本 来 估计 它 的 数学 
期 望 向 量 py 和 秒 方 差 和 矩阵 五 是 一 个 十 分 重要 的 问题 。 与 其 补 联 
系 , 对 于 多 元 正 恋 分 布 的 其 他 参数 ,如 相关 系数 , 仿 相 关系 数 , 广 义 
方差 等 也 有 息 亦 的 估计 间 题 。 此 外 由 于 这 些 估计 量 部 是 样本 的 统 
计量 ,当然 希望 了 解 它 们 所 服从 的 分 布 , 从 而 为 进一步 探讨 这 些 统 
计量 与 被 估计 的 参数 的 关系 创造 条 件 。 本 章 要 讨论 的 正 是 多 元 正 
态 分 布 的 参数 估计 问题 。 

在 一 元 统计 分 析 中 ， 大 家 都 已 热 知 求 参数 的 极 大 似 然 估计 的 
方法 。 本 章 主要 的 内 容 就 是 利用 极 天 似 然 法 求 出 多 元 正 态 分 布 各 
种 参数 的 极 大 似 然 估计 。 由 于 极 大 似 然 估计 往往 比较 简单 而 且 具 
有 许多 优良 性 质 ,在 实际 问题 中 得 到 许多 应 用 . 

在 本 章 开始 ,我 们 先 将 有 关 记 号 作 一 叙述 ， 

设 有 其 一 个 了 维 正 坊 总 休 一 NN,(p, 了 ),2 之 0 ,对 决定 该 分 布 
的 参数 站 和 三 我 们 要 作 甸 估计 。 为 此 我们 从 该 总 体 中 独立 地 抽取 
了 容量 为 + 的 随机 样本 (通常 # > pg》, 即 简单 样本 , 记 为 x,，*……， 
xX。。 我 们 将 在 x; 的 观察 值 为 基础 上 进行 整理 ,分 析 , 然后 得 到 #， 
> 的 估计 ， 以 后 我 们 记 


KX Ces x) 为 样本 矩阵 
。 于 一 十 了) x; 一目，1。 为 样本 均值 商量 。 (1.1) 
4m 
s——! /4 为 样本 小 方差 算 隆 


es 732， 


其 中 
A Tx Rx RY XK EK ELY 
于 一 了 
KX' p 天 : 一 (uc 一 工 Ll:) x (C1.2) 
六 
根 庶 的 我 们 称 上 | 为 正 态 总 体 的 "广电 方差 ", 而 15| 则 称 为 样 
本 的 * 广 尽 方 莽 ”。 


如 冶 总 体 协 方差 掉 阵 了 的 分 块 一 样 , 我 们 也 常 将 8 (或 4) 进 
行 相 应 的 分 块 ,车 记 
$,, Si 
“一 四 s 


其 中 5 是 rf xr 阶 ， 5 是 Xs5 界 , ?十 一 2， 则 
S11 S22 称 从 本 的 子 苏 方差 定 阵 
Si HO S502 Sr S'S 称 样本 的 入 
《条 件 ? 协 方差 先 话 ， | | 
引用 第 二 章 第 四 节 的 记号 ， 则 有 
. 一 | 
而 衫 应 于 #4 之 了 时 祥 本 的 联合 密度 为 。 
HK) 一 Gay Elzl err [= + Ex ~ pIX— ps) | 
mm (C2) | | ierr |- 2 一 | 
《1.37 
其 中 第 二 等 式 是 在 蕊 一 ls 中 分 济 加 减 二 1 计算 得 到 的 。 
$ 4.1 期 亡 向 量 * 和 协 方 总 给 阵 了 的 估计 


在 本 节 中 我 们 将 讨论 思维 正 态 总 体 和 ,CpR,， 了 ) 的 参数 pg 和 3 
的 极 大 似 然 估计 ;一致 最 小 方差 无 偏 估 计 以 及 这 些 舍 计 最 的 浙 近 
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正 态 性 等 铂 质 ， 

(一 ) 及 亚 的 极 大 俱 然 估计 

首先 我 们 用 航 大 似 然 法 求 出 WE) 由 世 和 王 的 极 大 似 伏 
估计 ,然后 讨论 这 些 佑 计量 的 性 质 及 其 分 布 ， 

设 xx 相互 独立 且 服 内 NCR:3),2 > 9,n 祈 p， 则 
此 时 驻 的 联合 密度 为 (1.3》 
式 ， 它 婚 是 X 的 函数 , 叉 是 pp 各 的 讽 数 ， 在 导 求 pg. 和 了 的 极 大 
催 然 估计 时 , 在 (1.3) 中 将 的 值 看 成 是 圈定 的 仅 糙 (1,3) 视 为 (p， 
三 ?的 遂 数 :此 时 (1.37 称 为 似 然 衣 数 工 (323 注意 到 (4.3) 式 的 两 
重音 六 的 盖 别 。 下 本 求 L(p，>) 的 极 值 ， 

引 理 1.1 设 8 是 乡 X 靖 阶 正定 抑 隆 ,那么 对 于 所 有 户头 袁 阶 
正定 第 阵 ,有 


Kz) 一 [21 Texp{ ~ 二 ec 志 全 


-了 一 地 
ep( -2 ) (C1.4) 
县 等 号 成 立 的 充分 必要 条 件 是 了 一 三 S§. 


证 明 由 于 了 ,5 正定 , 按 第 一 章 定 理 3.11， 存 在 非 奇 异 矩 阵 
已 ,使 得 Ss PP, 5 = PDP, 其 中 下 一 下 ag(3 0， 四 是 
三 相对 于 .3 的 特征 概 , 于 是 尖 旦 变动 时 4 也 随 之 变动 ,由 于 


. 
PA 


t= 


本 
tr se tOPI DIP Pe Pt Di SA! 


t=1 


(1.4) 式 可 改写 为 
fas ,1p) 一 NI 人 (IT 1 ) Yerp( — 二 六 7) 


[i 


= 181 于 1 | ee 人 (一 rn) Cl.SY _ 
电 对 数 函 束 的 单调 性 以 1.32 或 (1.5) 极 太 等 价 于 对 每 一 了 使 得 
e 134. 


La 1 
A 一 oo ]n4 一 -一 -~ 
eC > 2 Ds 2 


达到 最 大 ， 由 于 当 收 之 上 时 有 
< 


1 Co A 
41) 一 一 一 一 
8 CL) 2 区 


所 以 gC4Y 当 且 仅 当 下 一 过 时 达到 极 大 ， 即 


Dos 人 (区 


且 等 式 成 立 的 充分 必要 条 件 是 和 一 一 加 一 二， 即 
3 一 PDP 一 上 本 一 上 5 和 - 
Le 天 


定理 11 当 X~ NN， "pe 1 > 人 0 时 内 县 了 


的 极 大 似 然 估计 分 别 为 到 和 一 ACF 和 和 有 4 由 0.1)，(1.2) 式 所 定 
你)。 
证 明 由 tt. 3) 式 知道 似 然 省 激 为 


EL,E) = (2r) 下 | 了 | op|— tis- 14 
— nz — py2-(a— p)| 


及 由 之 0,n 之 p 及 第 三 章 引 理 2.1 知道 4 以 概率 1 正定 ,于 是 
由 引 理 1.1 知道 当 


站 一 二 立 一 二 4 
时 LLC,2》 达到 它 的 极 大 值 , 即 ， 
LOps2) EL (x, 1 4 一 (2xy 3 加 4 em( 一 2). 


* lI35. 


所 以 这 和 十 4 是 靖 和 卫 的 航 大 似 然 估计 。 量 
根据 第 二 章 定 理 2.3 我 们 知道 
元 一 N, (er 二 5), A~ WCn— 1,2) 
且 相 过 独 立 。 
(二 ) EE 及 王 的 一 致 最 小 方差 无 偏 估 计 
定理 1.2 和 5 一 一 :一 4 是 和 3 的 光 偏 估计 


一 


证 明 由 于 ~ No (ps 二 三 ) ,所 以 Ex 一 py， 到 是 皮 的 无 
偏 估计 ， 且 此 时 Yn (下 一 J) ~ NC0,3), 政 


EA=E [> (xi — Nx; 一 a) | 


~E [Dp Vp) 


* Vals— py)| 
HES (Cn 1)3, 


所 以 BS 一, 即 5 一 一 4 是 3 的 无 仿 箔 计 .， 

由 前 面 所 述 ，(x,A》 对 于 (py,3》 的 代 计 十 分 重要 , 椒 仪 如 
此 ,我 们 还 将 指出 (于, 4) 是 正太 分 布 族 的 充分 完备 统计 量 . 这 
里 我 们 主要 对 充分 绕 计 量 进 行 讨论 。 为 此 我 们 简单 同 顾 一 下 有 关 
概念 ， 

1) 设 五 一 《xi 四 是 以 分 布 族 为 {F(x,0),0e 8} 中 
抽取 的 样本 矩阵 ，T(X)》 是 某 一 绕 计 量 , 如 果 给 定 工 ( 邢 ) 一 :后 ， 
区 的 条 人 忻 分 布 与 参数 9 无 关 , 则 称 T(X) 是 分 布 族 F(x, 由 (或 的 
的 充分 统计 量 ， 

按 Neyman 因子 分 解 定理 ; 如 果 总 笨 分 布 具有 密度 人 x,9) 


* 3。 


香甜 本 的 联合 密 刘 可 分 解 党 
FCX,0) 一 [| ix;,8) 一 CX) * gC(T(RYO) 


其 中 TC(X) 是 绕 计 量 ，h CX) 是 境 本 的 非 鱼 函 数 且 与 8 无 关 ， 
gC(T(), 昌 ) 仅 通过 工 (X) 依赖 于 样本 XX, 那 末 T(X) 是 的 这 
分 统计 量 ， 

2) 设 分 布 族 为 {FCx,0),9e 日}, 如 果 对 任何 一 个 满足 

Egg(tx*)— 0 对 一 切 日 成 立 
的 随机 变量 g (x), 总 有 
Polglx) ~ 0) 一 1 对 一 切 日 成 立 

则 称 {FCx,8),0 < @} 是 完备 的 。 如 果 避 一 (xx) 是 从 
该 分 布 族 抽取 的 样本 矩阵 , 线 计 量 TCX) 的 导出 分 布 族 是 完备 的 ， 
那么 称 TCX) 是 分 布 族 {F(x,9)，9e 8B} (或 昌 的 完备 统计 量 ， 

3) 设 关 一 (x,,…- ,Xx。) 是 取 自 某 一 总 体 的 样本 矩阵 ， 总 生 
参数 为 ,如 果 存 在 日 的 一 个 无 偏 估计 扇 X), 使 得 对 8 的 年 意 一 
个 无 偏 估计 多 X), 总 有 sa 

covCBCX)) 所 covCBCX)) 对 一 切 日 成 立 

则 称 成天 ) 是 6 的 一 致 最 小 方差 无 局 居 计 

若 TCX) 是 日 的 充分 完备 统计 量 , 且 gCTCX)) 是 6 的 无 全 
估计 ,那么 eCTCX)》 是 日 的 一 致 最 小 方差 无 偏 估计 .。 

定理 1.3 (x,A) 是 (py,2》 的 充分 统计 量 . 

证 明 “由 于 样本 联合 密度 为 

(CX) 一 (2r) 学 131 7 
]】 一 -: _ 了 
et {— 124+ a — XE ~ py 


接 因子 分 解 定理 邑 可 知 《 过 ,4) 是 Lp, 了 ) 的 充分 统计 量 。 国 
此 外 还 可 证 明 (如 ,4) 是 (py, 信 ) 的 完备 统计 量 ( 人 参考 【317 


定理 14 站 和 3 一 -二 4 三 和 的 一 致 最 小 方差 无 


» ij7* 


偏 帖 计 。 
证 朋 ”由 于 苗 利 $8 是 和 Zz 的 无 偏 估 计 , 而 且 ( 于 ,有 4) 是 充分 
完备 统计 量 , 所 以 它们 是 一 至 最 小 方差 无 偏 估计 ， 上 征 

由 上 面 讨论 知 py 的 极 大 似 然 估计 x 同时 也 是 一 臻 最 小 方 着 
无 全 估计 。 而 互 的 极 大 似 然 估计 二 4 与 一 臻 最 小 方差 无 偏 估计 


-二 二 4 相差 一 个 售 数 二 一。 在 实用 中 种 用 》 估计 3 因此 称 
3 为 样本 的 协 方差 矩 隆 ， 

关于 三 和 4 的 其 他 优良 狂 质 等 可 参考 [61. 

(三) 和 人 S 的 大 样本 性 质 

在 (一 ),( 二 ) 讨 论 中 总 假定 总 体 为 正 态 分 布 ,事实 上 即使 总 体 
不 是 正 态 分 布 的 ,二 和 5 当 样 本 容量 趋 于 无 限时 的 仍 具 有 良好 的 
性 质 。 下 面 定理 1.5 和 定理 1.6 分 别 讨论 了 它们 的 按 概率 收 化 性 
和 浙 近 正 态 性 、 

设 和 一 《xz,，…xa) 是 取 自 某 一 总 体 (不 必 为 下 态 ) 的 样本 抵 
阵 ,总 体 的 数学 期 望 向 景 为 4, 协 方差 矩阵 为 卫 , 吕 和 4 是 由 《11) 
和 (1.2) 所 定义 的 ， 那 么 有 

定理 1.5 (大 数 定理 》 设 x,,…x。 是 从 具有 均值 向 盘 py, 协 
方差 矩阵 3 的 总 体 中 独立 抽取 的 容量 为 ”的 简单 样本 ， 则 当 * 一 
oo 时 有 


1) 过 按 概率 收 化 于 Ps 即 元 二 >。 (1.6) 
2) 小 4 按 概率 收 合 于 了, 即 十 4 一 > C1.7) 


证 明 ”利用 一 元 的 大 数 定 理 ,知道 对 总 体 的 每 一 分 量 有 
Bl > wi pe (i= ,pp) 
经 t 


i= 


其 中 x 是 的 第 i 个 分 量 , 吝 是 的 第 i 个 分 量 。 从 而 1) 
成 立 ， 
。 38。 


落 记 A = Ca) TD 
#9) 风 
二 


一 二 >) 《zx 一 ECE — £1) 
但 名 《1 


1 总 _ _ 
三 DD) ra Cr pt pO Bi) 
#=1 


一 二 3 Cr pnt 一 本 一 《2 2 CR py) 

由 于 ECxi 一 Kr) Ci 一 和 | ™ cgs 由 一 元 大 数 定理 知道 上 式 第 一 
项 被 概率 收敛 于 oy， 而 第 二 项 被 概率 收 化 于 0， 于 是 有 上 4 一 ~ 
-| 

式 (1.6)、(1.7) 的 实际 意义 是 : 当 4 亮 分 大 时 ,于 和 小 4 以 
氨 近 于 1 的 概率 收 全 于 p 及 ,而 以 8 代 畦 二 4 也 有 柱 同 的 结 
论 。 

定理 1.6( 中 心 极 限定 涅 ) 设 xx。 是 从 共有 均值 向 晶 


和 和 协 方差 第 阵 了 的 总 体 中 独立 抽取 的 容量 为 的 简单 样本 ， 则 
当下 一 oo 时 有 


wa (天 一 上 一- 3 《2 一 上 
Ar 上 
奖 近 地 服从 NiK0,5)。 


证 明 只 须 证 阴 vy n(x 一 jp) 的 特征 通 数 当 * -co 时 玻 钱 
于 N,(0,3) 的 特征 函数 即 可 . 


且 Bus 一 0， E 吉 一 #2t， 由 一 元 中 心 极限 定理 知道 x, 渐 近 地 服 
从 NC0,#34), 而 ws 的 特征 函数 是 加 
Pos) Ee Eexplis rt n(x — pe)] 


而 NC0,# 24) 泪 应 特征 函数 是 ezp( 一 二 2t), 于 县 


+ 了 39， 


Jie pad 人 一 exp( 一 es) 
令 5 一 1, 就 得 到 


Bm ET expit’ n(x 一 A)] 一 exp 半 2 rst} 


即 W za (x 一 py) 的 特征 函数 当 # 一 oo 收 化 于 N00,3) 的 特征 函 
数 。 定 理 得 证 。 时 | 

定理 1.6 告诉 我 们 ,即使 总 体 不 是 正 访 分 布 , 但 它 的 样本 均值 
向 量 当 容 量 ”充分 大 时 总 可 也 看 成 是 正 态 分 布 ， 而 且 胃 应 的 参数 
p 和 可 以 用 这 和 二 A4( 或 们 来 代替 .这 样 一 来 , 非 正 态 总 体 只 要 
它 的 样本 容量 # 充分 大 ,都 可 以 用 前 面 讨论 的 正 态 总 你 来 研究 . 例 
如 MV # 计 一 YE ME 一 J》 当 +# 充 分 大 时 渐 近 服从 Cp) 分 
布 ,而 当 了 未 知 时 ;用 81 代 埠 71， nt 于 一 YS 二 一 pp) 也 
可 证 明 它 浙 近 服从 Cp》 分布。 


§ 4.2 ”广义 方 整 和 相关 系数 的 极 大 似 然 估 计 及 
它们 的 分 布 


本 藻 特 讨论 正 坊 总 体 的 广义 方差 |>| ,相关 系数 of 偏 丰 关系 
数 ， 复 简 关 第 数 的 棚 太 似 然 佑 计 ， 并 对 用 作 估 计 的 统计 量 的 分 布 
进行 较 详 细 讨 论 ， 这 将 为 以 后 及 章 中 的 检验 等 问题 的 讨论 昔 定 基 
殴 。 l 

(一) 广 浆 方 短 和 和 关系 数 的 极 大 个 然 估计 

首先 回顾 一 下 第 二 童 第 三 节 中 有 关 概 念 及 记号 : 

设 总 体 x ~ 入, 了)，2 一 《oj) 这 0,3 可 进行 如 下 分 块 

三 一 人 > r+ 十 :一 则 
Ee Br $ 

pi 一 04/V awoii 称 为 分 业 x 与 与 的 相关 系数 

3 一 了 一 303513533 一 《Cowirtonp' 称 为 偏 ( 条 件 ) 供 沪 若 

® i40 + 


矩阵 
如 一 225a 称 为 回归 系数 御 阵 ， 


Fj} 
Piirfirerp ™ 
Vo is Cijer tseg 
称 为 x， 和 x; 的 俱 宁 关系 数 ， 
若 记 
< 一 他 )， 3 一 人 ™ ) 
Ni p 一 上 Ua Baz 
Eo [S22 
Paanip Dy 
Ls 


称 为 tz 和 xX 一 (wy sxp》 之 间 的 复 相关 系数 ， 

i21 称 为 总 体 的 广义 方差 

显然 上 述 这 些 参数 都 是 了 一 (oj) 的 函数 ,为 了 给 出 它们 的 
极 大 亿 然 信 计 量 ,我 们 对 样本 协 方差 矩阵 也 作 相 应 的 分 类。 记 


A Da RY (eS i A (si) 


以 及 Ss 
< La + #1 二 过 
4 的 人 ' 3 GS. 5) 了 
我 们 将 称 了 syf Vis 一 tl ai ”a 
为 xz 和 样本 相关 系数 . 
Bo Sn AnAs 


汐 样 本 回归 系数 和 矩阵 
Sa 一 亲 二 1 Hp 本 1 1 《ifr+teop 
汶 样 本 的 偏 ( 条 件 ) 协 方差 短 阵 ， 
Fij ,rtp 了 .十 Le 和 


为 入 和 i 的 样本 偏 和 相关 系数， 


了 


A a 人 a ) Ky sr 由 85 ) 1 
a /np— 1 #1 Su Pl 


” co—1 . 一 1 
Fp 一 2 Ba fie a 1 


Ta 他 [9 


为 ma 与 如一 《如 -xz 之 闻 的 样本 复 相关 系数 ， 

下 面 引 理 2.1 常 称 为 统计 方法 中 航次 做 然 估计 的 不 变性 。 它 
可 用 来 从 某 些 参数 的 报 大 仆 然 估计 推出 它们 的 函数 的 航 大 似 然 个 
计 ， 

引 理 21 设 一 分 布 的 参数 9 的 变化 范围 0 是 R* 中 的 一 个 
区 间 , 似 热 末 数 L(8) 是 从 9 到 实 贡 玉 的 里 象 ， 设 请 是 日 的 极 大 
似 然 合计 ,6 的 值 域 是 ,19) 是 从 人 2 到 04 的 一 个 变换 ,其 中 0* 
是 RC 心率 ) 中 的 一 个 区 间 , 那 么 人 9) 的 极 大 似 然 估计 是 6)。 

证 明 对 9* 中 的 任 一 元 素 w*, 沽 虑 0 中 的 集合 

Piow*) = { 日 :上 ED 日 TO) ~ cw*}, 


Mle) ™ pp., £0) 
显然 M(m*) 在 0* 上 有 定义 , 它 是 由 16) 导出 的 定义 在 Q* 上 
的 导出 侯 樵 函数。 对 0* 中 任 二 点 w+ 和 az ,只 要 az wf， 则 
Far 和 FCw*) 没有 共同 的 点 ，{EFKo*+ ,wm* EQ*} 构成 了 0 
的 一 个 划分 。 日 一 定 属于 且 只 属于 蘑 一 个 F(w*), 不 妨 设 语 呈 
1 如) ,于 是 和 6€ FC 蚁 ) 二 是 0* 中 一 个 确定 的 元 素 , 于 是 
(的 一 sup, LC) 一 MG) > L(0) 对 一 切 6e 0 成 立 ， 


即 
(起 ) 宇 SP-， 工 (日 ) 一 对 [oo*) 对 一 切 GO* € 0* 成 立 ， 
于 是 命 一 16) 是 w 一 09) 的 极 大 似 然 合计. 目 
定理 2.1 设 刀 ，- xs。 基 从 总 体 Ra ED 抽取 的 容量 为 
第 的 简单 样本 《E > Dn ps 那么 
* js 


1) psj 的 极 大 位 然 估计 是 Pa。 

2) FP = B22 和 zi 的 极 大 似 然 估计 是 站 一 oa 粕 
1 Al.2 
六 [3 


3) Pijue th 和 和 PIs2enp 的 极 大 侯 然 估计 是 入 tlre ps Fed ps 


4) 121 的 极 大 似 然 估计 是 | 二 4|. 
证 明 由 于 二 4 是 了 的 极 大 伏 然 估 计 ，ers8，8is 都 是 op 


的 函数 ， 而 pivHws。 由 递 推 公式 知道 也 是 of 的 务 数 ，|21 和 
入 ，,。 也 同 祥 是 oi; 的 函数 ， 从 而 由 引 理 2.1 知道 它们 相应 的 极 


大 似 然 估计 正 是 上 4 所 构成 的 相应 统计 量 。 时 


例 3.1 玫 2.1 中 列 出 了 从 M、N 两 地 区 各 独立 抽取 的 30 块 
矿石 样品 ， 其 中 包含 对 六 种 化 学 元 素 的 含 亿 的 测量 数据 。 假 设 它 
们 构成 了 一 个 来 自 Wen ,3) 的 祥 本 ,根据 前 面 导 出 的 有 头 公式 ， 
求 出 总 体 各 参数 的 极 大 似 然 佑 计 值 ， 


解 a) MM 地 区 
401.4000 


37.5667 
27.6667 
38.3000 
32.8333 
32.1000 


1) Bx — xu 一 


1 
23 立 ， 一 一 4 
》 Zu 30 4x 


26315,9067 1372.6067 1283.0000 —480,.9867 —286.8667 1735.0933 
455.9786 66,Bi22 —27.8700 —219.2056 184.8100 
22#.4889 10.2667 —37.1889 92.6667 


85.6767 61.6167 1.0700 
213.1399  —02.43500 
190.0233 


143= 


3) 梯 本 坦 关 矩阵 Ry 二 Cra)w 
1 0.39625 0.52904 一 0.32033 一 0.12113 0.07830 
1 0.20923 一 0.14100 一 0.70315 0.62784 


1 0.07419 -一 0.17039 0.44967 
“ 1 0.45597 0.00839 
1 一 0.45938 


1 


4) we 关于 XL 一 《zi xy 的 样本 回归 方程 。 
根据 第 二 章 第 三 节 中 记号 知道 车 记 


| [1 Eu Tre 
= 人 he 人 (wh 
‘Xe -Es Ts se 


4 
则 zs 关于 x 一 (x,…' ,wy》 的 总 体 回归 方程 为 
x Ke OuZi x, 一 A), 
令 上 及 分别 以 它 的 极 大 似 然 估计 宇和 十 4 代 人 得 到 x 关于 
x 一 《m4,… ,的 (样本 ) 回 归 平 面 方程 为 


x — 311.43056 一 0.86396z, 十 1.14507x, 十 0.7960123 
一 0.42641x, + 0.57118xs 


5) Ts 关于 (x1s ~"? ss) 的 祥 木 复 相 关系 数 为 
rons 一 0.86212 
6》 若 千 样 本 偏 相 关系 数 


ror 一 一 0.45463 rye — 9.27326 
Poorlphs 0.18749 


b) NN 地 区 
"144* 


355.1667 
| 62.7333 
| 12.4667 
| 21.1667 


\ 8.2667 
22.3667 


2) Ey jo A 


1) Ry 一 Zn 


14586.4056 686.0L41 262.5222 —213.6944 —24.2444 —102.9278. 


388 .8623  —22.5422 一 村。 征 5 各 看 ,二 牛 嫩 才 36 631 

40.4489 一 了 ,3444 一 上 .5941 23.4289 

™ 13.8056 1.1222 站 .3389 
1.5289 半 .8D 之 2 

87.9656} 


3) 样本 相关 嫩 阵 Ry 一 (Cra)y 
1 0.28804 0.34177 一 "0.4760 —0.14226 —0.09087 


1 一 0.17974 —0.06081 0.25036 0.30620 
Ry = I 一 0.14153 —0.20233 0.39277 
1 0.2z4427 0.18190 
1 0.41409 
1 


42 中 关于 〔〈2 xs》 的 样本 回归 方程 为 
we = 119.1611 一 038630x3 十 0.44783xa 十 D.6R6190x3 
十 0.02981x 十 0.37855x; 

5) 如 对 〔〈e 9) 的 样本 复 相 关系 数 
res = 0.77710 

6) 若干 样本 余 术 关系 数 

rs — Db.406897 # ma 一 OD.33618 

ronan = 0O.49666, 

从 上 述 订 算 的 各 需 结 则 可 以 了 解 到 ,两 地 区 矿石 中 六 种 


5 


光束 的 平均 含量 ， 每 个 池 信 入 五 中 包含 的 元 案 含 惰 的 旋 互 依赖 关 
孙 ， 可 以 根据 部 分 元 素 的 含 局 推算 出 其 他 元 素 的 全 量 等 ， 这 些 都 
是 十 分 有 有 用 的 。 另外 我 们 往往 还 希望 对 两 地 区 的 矿石 进行 比较 ，、 
鳝 如 希望 了 解 这 两 地 区 矿石 中 元 率 售 和 量 除 了 随机 性 偏差 外 能 否认 
为 相同 。 和 如 果 不 相同 ， 那 么 那 一 个 地 区 更 具有 利用 价值 等 等 。， 这 
些 问 题 的 解决 将 在 第 五 章 和 以 后 各 章节 中 逐步 解决 

(二 样本 的 儿 人 条 解释 

在 本 小 眉 中 我 们 将 从 几何 角度 来 说 明 样 本 相关 系数 和 样本 
广义 方差 的 直观 意 义 。 设 从 ?P 维 总 体 获得 一 个 容量 为 # 的 祥 本 
2 Xa sy 则 样本 给 阵 为 


x 
无 一 《Xi XO— ， > 
wy 


于 是 可 以 从 两 个 角度 来 认识 蕊 . 一 种 观点 是 将 天 的 烈 向 量 xz， 


x。 看 成 是 R* 中 的 # 个 点 ， 那么 时 一 冒 如 正 是 这 4 个 点 
的 重 阅 二 ,这 时 


tA= tO— XU NX — #1Y = 5 (x; 一 天 ?Xi 一 昂 ) 
Fl 
基 该 # 个 点 与 重心 之 间 的 距离 的 平方 和 。 它 在 一 定 程度 上 反 岗 了 
总 体 协 方差 算 阵 了 的 tr 了 一 > aa 《总 方 荆 和 的 大 小 ), 从 而 从 一 


个 侧面 反映 了 数据 的 变 录 性 。 
另 一 种 观点 是 将 七 的 各个 行 向 景 xf 一 1 ,Pp)》 团 成 是 
R* 中 的 ?个 点 或 者 乡 个 向 量 。 而 1 作为 R* 中 的 一 向 量 , 它 与 各 


A Ve . 向 量 
x 中 在 该 方向 上 的 投影 正 是 和 
i 1, sls a 1 
(x vn 外 -万 | 5 
其 中 去 是 三 的 第 i 个 分 量 。 因 虽 x 一 zi 将 与 该 方向 垂直 , 记 
* 于 人 人。 


HR 


= 


jp i 


和 


本 1 了 
300 
S00 
S00 
300 
SDO 
210 
265 
0 人 
200 
S00 
500 
过 3 了 
232 
217 
100 
了 和 看 
250 
250 
S00 
333 
450 
400 
650 
650 
站 50 
二 5 
S00 
00 
goo 


Ni 
23 27 13 37 
30 35 20 35 
4 35 20 35 
20 30 8 30 
20 30 8 30 
10 35 2 让 35 
9 20 35 40 
在 55 45 29 
0 30 30 40 
10 50 30 40 
32 33 27 33 
32 33 27 25 
妆 2 ， 38 
9 32 38 
19 33 29 25 
10 30 24 55 
17 51 57 EI 


rAd 


元 陨 
样品 登 

i 200 ETH 1 25 + 20 
2 200 43 1 23 6 1] 
3 450 60 10 20 县 20 
和 4 200 50 1 25 9 2 
5 200 50 10 325 7 20 
看 . 333 83 13 22 3 23 
多 150 41 10 20 | 22 
8 150 41 10 20 9 22 
9 450 60 10 20 8 20 
20 8 20 
25 7 23 
| 站 9 22 
24 10 34 
20 9 22 
25 10 3 
16 7 ED 
15 7 1 
i5 7 1 
了 了 了 所 25 
18 10 30 
23 10 18 
16 了 9 
1 5 7 1 
? 7 27 
24 名 2 
18 1 30 
23 | 10 28 
30 9 15 
20 20 
25 | 8 30 


"48. 


起 ; i x 一 贡生 
怎 是 x@ 在 投 影 后 的 剩余 问 量 , 藻 将 e 不 改变 大 小 和 方向 求 克 刘 
以 原点 为 向量 起 点 , 那 冬 这 个 剩余 向 量 长 度 的 平方 和 正 是 
le 下 一 oie; ~ (x® — Zl) (x — Ble) 


™ 3 《xi wi 


1=1 


注音 到 第 i 个 分 最 x， 的 样本 方差 应 是 


Si 一 二 一 中 一 1 >, Cxij 一 ED 
一 1 


一 一 le 《2.2) 


于 是 e; 的 长 度 与 第 i 分 量 的 样本 询 方 差 成 比例 ， 
利用 向 量 的 内 积 知道 ， 设 剩余 向 量 和 ei 的 实 角 为 Qt 导 
么 


《ee = ee 一 ellleillcosen 
一 Cn 一 和 eco 一 和 
所 以 
cos6 — 三 (Co 一 5 一 到/ 


Fx — Ey 


* Zr 一 
™ sds sh 
| = ih {2.3) 
这 说 明 分 量 和 xi 的 样本 相关 系数 正 是 璋 余 向 量 @ 和 全 的 来 
角 余 获 的 大 小 ， 于 是 如 果 剩 余 向 量 几乎 同 向 ， 样 本 相关 系数 接近 
于 1, 如果 垂 直 ， 则 样本 相关 系数 几乎 为 0。 如果 剩余 向 量 儿 平 罗 
向 , 划 样 本 相关 系数 毛 近 一 1。 


"i149» 


样本 广义 方差 15| 提供 了 招 所 有 祥 本 方 关 和 协 方 吝 台 并 为 一 
个 狐 量 指标 的 方法 。 作 为 |21 的 估计 是 有 用 的 。 下 面 给 出 151 的 
一 个 直观 解 灵 ,首先 考虑 p 一 2 时 ,两 个 剩余 向 量 el 和 和 二 所 生成 
-的 平行 四 边 形 的 面积 的 绝对 值 为 
So = jellell dn 0,| 
= (4 Vn Cl — 174) 
其 中 第 二 式 是 利用 了 (2.2) 和 (2.3) 式 ， 


另 一 方面 有 
， .|# 了 
131 一 "| 一 51322 一 38 | 一 ra 六 
Sat F222 
从 而 
18| 一 35 — 1) 《2.47 


由 上 归纳 尘 可 以 证 明 (参考 [7]); 由 靖 个 剩余 虚 量 @ 所 张 式 的 ( 广 
义 ) 平 行 六 面体 的 体积 与 广义 方 凑 之 闻 有 关系 式 
181 一 《体积 了 /(n 一 1)? (2.5) 

由 此 可 见 , 当 莉 余 向 量 e 的 长 度 增加 时 《 即 s; 增加 时 ) 体积 
增 大 , 18| 变 大 。 或 者 e 与 ei 的 交角 起 于 荆 直 ( 即 相关 系数 ra 趋 
于 0 时), 体积 增 大 ，|$§| 变 大 ， 由 于 e; 反映 了 第 i 个 分 量 的 样本 
值 偏离 它 的 平均 值 的 大 小 , 那么 由 @; 张 成 的 体积 可 近似 地 看 成 ? 
个 分 量 篇 离 平 沟 向 量 的 一 个 综合 度量 ， 当 然 以 一 个 数 度量 了 个 变 
量 的 偏差 的 综合 状态 总 是 有 不 证 之 处 ， 例如 当 恰 好 有 一 个 5;; 很 
小 或 者 有 一 剩余 向 全 几 平 处 于 其 他 二 个 或 者 二 个 以 上 和 镜 余 向量 张 
成 的 超 平面 上 时 ,都 将 使 得 它 的 体积 近似 于 0。 

定理 2.2 样本 广义 方差 为 0 的 充分 必要 条 件 是 至 少 有 一 个 
梨 余 向 量 在 其 他 璋 人 向 语 的 线性 组 合 所 形成 的 超 平 面 上 。 
证 骨 ”由 于 


e, XY — zt 
各 xX 一 xl, 


mi - i rn 


» S50 * 


以 而 3 一 一“ 世 .由 第 一 章 定理 14 知 道中 (3) 一 rkCE). 


而 151 一 0 等 价 于 下 63 之 p， 凤 zkCE》 < p。 它 的 充分 必要 
条 件 正 是 诸 上 中 在 在 线性 相关 ， 定 理 成 立 ， 蜂 

《三 ) 样本 广义 方差 及 样本 租 关 系数 的 分 布 

设 xz, xn 相互 独立 且 服 从 We ED 之 2，,> > 0)。 样 
本 的 协 方 差 短 阵 为 


1 _- yr 
5 一 二 二 4， (4— De — x — ay) 
从 而 样本 广义 方差 

1 ~ (a — 19 1|A| 
由 第 三 章 定 理 2.3 知 4~ 邢 jl# 一 1,2)， 叉 有 第 三 章 推 论 2.7 有 


13| = Cx 1)?: |3|: I 


其 中 相互 独立 且 分 别 服 从 Xn 一 站 (Gi 一 1,p) 
.因此 当 pg 一 1 时 1$1 的 分 布 正 是 eX(xn 一直， 涩 pp 一 2 了 可 以 
证 有 明 ( 参 考 文献 [151) 

2C4 — 1)* VISIE| ~ X62 — 2), 
当 pp 空 3 时 很 难 求 出 它 的 精确 分 布 ，Anderson 《参考 文献 [7?1) 
指出 : 当 n 一 oo 时 


V# 一 1 (4 一 1) 源 近 服 从 NGo,2p)， 


iz| 


设 总 体 服 从 N,CE,2)。 之 08 pi 一 9#1WVonag 是 总 
体 相关 系数 ，rii 一 ayPw enan 是 从 # 个 样品 求 得 的 样本 相关 系 
数 。 它 的 分 布 与 pi; 有 闭 密 切 的 关系 。 当 p 一 2 时 ,我 们 可 以 求 得 
样本 相关 系数 的 分 布 ,而 当 p 之 2 时, 仅 当 了 是 对 角 阵 时 ， 我 们 
能 够 求 出 R 一 《rz 样本 相关 年 阵 的 分 布 。 下 面 分 别 对 p 一 2 和 
pp 之 2 进行 讨论 ， - 

1 当 p—-2 


* isl" 


设 总 休 x* 一 (REJ) 其 中 


oi 
z=-( 1 “> 


2 
Ply Os 


从 该 总 体 抽取 的 样本 矩阵 为 下 一 (xxz 2) 网 攻心 
NiaCHl, TD) 此 时 
好 一 其 大 CO— nk 


一 一 (一 二 1， 
t= 


J di 
“ 人 a 
样本 相关 系数 为 r 一 oofwW an * au 
首先 我 们 作 一 简化 , 令 4 一 D4D, 疡 一 diag(srtoz9， 册 
全 ds , = 1 Pe 
2—( ) ~ Wkn — 1,2), 5 (， 上 > 


21 dz 
而 且 


记 


一 Hu/ Vind 一 oajwW aaea 一 rr。 
因 旺 要求? 的 分 布 ， 不 此 一 般 性 可 设 了 一人。 我 们 分 一 0 和 
pxs 拓 0 润 种 情史 进行 讨论 . 
ip 一 0 的 情况 
定理 2.3 当 总 体 相关 系数 一 0 对 ,二 维 正 坊 总 体 N:CR,E) 
(2 > 0 的 样本 祖 涯 系 歼 ”的 密度 为 


.TT nt _， 
fr 一 《1 一 C2.6) 


证 有 明 由 Pp 一 0, 知道 44~ Wtn 一 1,12)， 于 是 4 的 密度 也 
Bg, 02 01 的 联合 密度 沟 
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‘#1 


e244 — 1) + Coano,— a) 7 exp[— 二 (eu 十 on) | 


作 谈 换 G12 /ques ,出 
J a Osa dh dr) 一 A Game 


于 是 Cas er or ) 的 联合 密度 为 
ecKZ 四 一 12。《l 一 1 Com) eb exp (-— 2 二 全 ) 
关于 ayg2a 分 别 积分 。 和 由 
们 ma 一 ‘erp (— do 一 2 TT = {2.8Y) 


以 及 


_ 一 如 一 如 一 “1 
Ce 
代入 (2.7) 式 可 直接 求 出 7? 有 窒 度 (2.6) 式 ,定理 得 访 ， 外 
定理 2.4 当 总 体 相关 系 教 P 二 0 时 ， 设 7 是 二 维 正 态 总 体 
Na 了 CE > 0) 的 样本 相关 系数 ,由 
Tn 2 rr 
服从 自由 度 为 # 一 2 的 + 分 布 _ 
证 朋 ”在 7 的 密度 (2.6) 式 中 作 变 换 :二 V5 一 271M 一 r*， 


于 是 
4 一 六 -+ 证 动 ， 
Jo DT 了 + ey 
从 而 了 的 密度 为 : 


{0 ~ TC 


村/， 
Vn 7 到 人 4— 2) 


YY ly 
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正 基 自负 度 为 #* 一 2 的! 分布, 时 

在 实用 中 为 了 检验 二 个 随 冻 变数 是 否 不 相关 《对 正 坊 总 体 册 
粮 验 它们 是 否 独立 ), 只 须 检验 它们 的 相关 系数 是 否 为 0。 因此 通 
常 先 作假 设 Ho:p 一 0, 根据 试验 数据 计算 出 +, 看 |r | 是 否 坟 大 , 当 
| + | 大 到 使 得 MV * 一 2 1rl/V1 一 二 大 于 六 se 一 作对 (e 是 
给 定 的 显著 水 平 ) 时 我 们 拒绝 Ho: p 一 0。 从 训 我 们 可 以 接受 
po 一 0。 具体 的 细节 将 在 第 五 章 第 五 节 关 于 锤 立 性 检验 中 进行 讨 
论 ， 

ii》 Pp 去 0 的 情况 

定理 2.5 当 总 体 相关 系数 P 关 0 和 灶 , 二 维 正 态 总 体 NiCp,5) 
《3 > 0) 的 样 杰 家 关系 数 > 的 密度 为 


HO 2 aT DN pT Cr 
-Sir (s+ rey (2.9) 
j=0 2 及 
证 明 见 本 童 附录. 


由 于 P 关 0 时 ， 二 维 正 态 总 体 桩 本 相关 系数 7 的 分 布 过 于 复 
如 ,我 们 常 利用 下 面 的 病 近 分 布 。 
设 
Lin JI 二 rr ro lnlte? 
2 1 工 一 * 2 1 一 2 


那么 当 = 一 c 时 V4 一 2(z 一 t) 渐 近 服从 N(0,1)， 即 当 * 


充分 大 时 = ~ N (2 二) 浙 返 成 立 。 


上 述 定 理 的 结论 可 推广 到 ? 维 正 态 总 体 的 样本 相关 系数 结 
的 分 布 , 即 

推论 2.1 设 xx。 是 从 总 体 和 N,Cp;》 中 抽取 的 容量 
为 4 的 简单 祥 本 (> pb， 了 之 0)，pii 是 总 体 中 分 量 *% 和 的 
相关 系数 ，ri 是 增 应 的 样本 相关 系数 ， 那 来 ri 的 分 布 密度 是 在 

“1534. 


(2.9) 广 由 用 my 代 持 ,ps 代 禁 。 后 得 到 的 密度 。 
证 明 设 
A DY Ce — Wr) (Ro Dx), 


t 


起 第 三 章 定理 (2.3) 印 有 ~ Wn 一 1,3)， 卫 (96), 又 内 第 三 
章 定 理 2.5 知道 


di Oi oj 
( 上 一 ( | 人 2 
再 利用 定理 2.5 推论 则 可 得 证. 国 
下 面 推论 2.2 将 利用 了 二 2 的 结论 推出 靖 维 正 态 总 休 的 样本 
偏 相 关系 数 的 分 布 . 
设 A 一 pp， 有 将 ,A 作 下 殉 
划分 


[i 


多 人 2 A (和 “0 
Sa Tas A Ars 


其 中 和 下 是 ? Xf?f 阶 ， 32 是 XI 阶 十 3 一 PP 有 相应 的 划 
分 , 此 时 总 体 偷 协 方 盖 矩 阵 和 祥 本 偏 协 方差 矩 阵 分 别 为 
二 1 Zu EB Ty = Coiprrtnp) 


， 一 4 一 .4 = Coirtyeap) 
总 体 偏 相关 系数 为 
rr 
样本 伪 相 关系 数 为 | 
ET ER * Gjispiir pe 
推论 2.2 ”如 上 所 设 ， 那么 变量 = 和 5 的 样本 偏 相 关系 数 
ri 的 密度 正 是 在 CZ- 和) 式 中 区 rpmpwogs 让 Pre 和 于 一 


?十 ?一 1 代替 7,p 和 # 一 1 所 得 的 密度 . 
证 明 ”由 第 三 章 定 理 2.6 知道 
A ~ ln mp Oo 1 Fh) 
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简 用 推论 2.1 的 证 明 立 即 可 得 证 。 国 
2) 当 记 这 3。 
设 区 二 《xi ，， 5 ~ Nepal, 5 ,1,) ( 互 > 0,n > p) 其 


中 
马 一 diagKeu， spp) 是 一 对 前 阵 


此 时 4 二 3 (Xi — EXO RY Ca) ~ Wls Oo— 1,2) 


记 相 应 的 样本 相关 系数 抑 阵 为 妨 一 《riD， 那 末 民 的 分 布 ( 即 
ri 的 联合 分 布 ) 有 下 列 结 论 ， 
定理 2.6 如 上 所 设 , 则 样本 相关 系 铬 和 矩 泗 卫 的 密度 为 
nl fl pl 
ra, (SO ee em 
且 中 与 ga “spp 相互 独立 . 
证 朋 ; 令 一 DAD. DD = diagCoi 本 :yoiy 二 。 则 
及 一 (C817 ~ HW ,Ln 一 ls1p), 
而 此 了 时 
7 一 Hil V Gn 一 gif Van ™ Tike 
因此 不 失 一 般 性 ,可 设 A~ Wtn 一 1 7 7， 它 的 密度 为 
Al 
prn— 1). 1A| t ( L4) 


作 谈 换 


fr Cf 1 Pp) 
Hi 一 anos (li 
此 时 
H(A a dp RD oll SiEIEF) 
a rl Si<iEp) 
~ I[ Vana — I Ga) 
[过 | [Be 
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幸 此 只 与 rs" " “opp 的 联合 密度 为 


etpsn— 1)* II a |R | 下 -人 Dexp | 一 pb a) 


z 


由 此 可 知情 与 ea ev 相互 独立 ,关于 or 积分 是 于 
| a ~“?(— lan) dai 2 者 e 一 下 (二 


计 自 后 册 得 尺 的 密度 为 (2.10) 式 .时 
当 = diag (Cons** * “ep 时 ， 了 本 的 边缘 分 布 正 是 定理 2.3 
中 所 给 出 的 (2 6) 式 ,只 须 将 rs 代替 (2.6) 式 中 的 + 即 可 . 
最 后 我 们 将 给 由 样本 复 相关 系数 "rz 的 分 布 ， 
设 总 体 x ~ N,(pR,2》 2 >t， Xx ;Xn > 户 ) 蚌 
从 该 总 体 抽 取 的 样本 年 阵 ， 记 4 一 > 《xz 一 天 zi 一 下) 则 
A~ Wotn Om 11,2), 
为 了 表达 方便 , 记 
Xi ou or er A 
一 人 ) 本 人 4 (® 人 
其 中 Xs 一 《2 “xy Fn 都 是 Cp 一 1) x ‘Cp 一 1) 阶 的 。 
总 体 里 相关 系数 为 
Blog ™— VW OE nN Ga on 
它 的 航 大 似 然 估计 正 是 样本 复 相 关系 数 
Finsp YaadAitanl on 
下 面 将 简 记 8 一 pg... p 和 Fp 
让 当 产 一 0 了 时 了 的 分布 
定理 2.7 当 总 体 复 相关 系数 户 一 0 时 ,样本 复 相 关系 数 了 有 
下 烈性 上 质 


F— “TP 7, 
PpP—ili—7 


~ Flp— 1,n—p) 《2,117 


“1S7 


证 明 首先 注 谷 到 8 一 0 等 价 于 六 一 92 一 0, 则 a 一 
ri， 因此 由 第 三 章 定理 2.6 知道 

aa 一 0 一 vilas ~ Wn CO Pon) Wp Ca Ca —p). 
且 与 C4,an) 相互 独立, 而 当 A 给 定时 ， 

Ga ~ N,_iC0, dy), 
由 第 三 章 定理 1.2 知 erdaes 的 条 住 分 布 服 从 op 一 1) 且 
与 4a 无 关 , 从 而 aaaas 的 无 条 件 分 布 仍 是 ma 一 1)。 并 
与 3 相互 独立 ， 由 于 1 一 产 一 qaf 4; 所 以 
np 7 ,Aonlon 
P11 Pp—1 gna on 

各 据 F 分 布 定 义 ; 知 道 F ~ FlP—1,#— p), hn 

注意 到 当 ”一 2 时 复 祖 关系 数 了 正 是 普通 的 相关 系数 *， 定 
理 2.4 V4 一 2 rjV1 一 r? ~ +(x 一 2) 正 与 本 定理 的 结论 相 
了 吻合. 

由 一 了 了 二 /1 一 守 ~ Fb 一 144 一 上 ), 站 接 可 以 从 
FF 分 布 密 座 中 作 适 当 变 换 得 出 ? 的 分 布 密度 ， 这 一 工作 留待 读者 
自行 完成 . 

ii) 当 屯 和 0 时 了 的 分 布 

定理 2.8 当 总 体 复 相关 系数 5 关 0 时 ， 则 样本 复 相 关系 数 
> 有 下 列 密度 

pb-2 


大 站 一 2 1 2 (1 7?) * 


(90 


-rsf 一 十 大 PP 
Br PF) C2.12) 
2 


证 有 明 见 本 章 附 录 。 
站 4358 香 


习 是 
4.1 设 于 人 = 1 > 映 是 从 总 体 和 NCH,2) 中 独立 抽取 的 容量 为 = 
的 简单 梓 术 、z>9,+>>p。 记 
豆 一 工 六 Ey 过 一 pp Cx ~ Cx 一 元 7。 


Fl jie! 


是 机 自 访 总 体 的 另 一 个 独立 随机 样本 ,证 明 
1) x — KAN; (os{1 十 +) 路 
Lda ed ER) 一 天) 一 放 一 

2 DA Pp — 2), 

4.2 设 CG 一 ls 4) 是 以 总 体 Npte9071p) 中 三立 抽取 的 容量 为 
s 的 简单 样本 ，*>>P， 试 求 上 及 0: 的 极 关羽 和 然 合计 ， 

4.3 没 yy 是 从 大 数 为 上 及 Zz 的 # 维 对 数 正 态 条 布 总 体 中 独立 抽取 的 
容量 为 * 的 简单 拌 本 《见习 是 二 第 15 题 ) 证 明和 的 极 大 似 然 估计 与 正 
态 总 体 完 全 一 样 即 

p= 1 六 tayietay 


到 一 1 > Clny; 一 lny)Cinyr 一 loFY 


#4.4 设 中 三 1esp) 是 从 正 态 总 体 NaszE) 中 独 了 并 岳 取 的 容量 
为 a 的 简单 社 本 ,而 yi 一 19…9m4) 是 了 愉 正 态 息 体 NE) 中 独立 抽 
取 的 容 基 为 n 的 简单 样 二 (>0) 且 表 样本 是 相互 独立 的 ; 记 


d= Be Bs — Dy A DO — Dy — DD, 


证 明 
1) pv35 的 极 太 似 多 估计 分 别 为 


A ~ 一 I 
= 无 。 区 < 总 = | 
[i 3 | i tA 1) 


2) 证 明 站 yp 于 相互 独立 ,并 指出 它们 的 分 布 。 
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Cp 区 中 独立 抽取 的 容量 为 所 1>2) 
的 简单 样本 :其 中 了 一 【 。 “) ;|p| < ip 是 总 休 扯 关系 铬 ; 记 


号 一 二 > xi。 > 人 xi — z) Cx! 一 更 :一 人 ") 


| iml 81z dr 
MAW O17), r= gf Vos 是 样本 相关 系数 ,证明 
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TE 站 (> 一 f 十 + 

其 中 和 一 各 (一 1 一 X 一 205rawC0s1l) 且 相 互 狂 耻 。 
提示 令 了 一 C .ec ,其 中 


co ( 1 u ) 
op wl pp 

于 是 CAC 一 人 HiKr 一 19)。 利用 第 三 章 定理 2.14 的 Barlett 三 角 分 
解 4 一 TT' 即 可 证 明 ， 

4.6 设 CG 一 439) 是 从 总 体 NLP 三) 中 抽取 的 容量 为 n( > 站 
的 简单 样本 试用 微分 方法 证 明 : & 和 工 的 航 大 似 热 佑 计 分 别 为 和 和 二 开 
其 中 二 和 4 是 习题 4.5 中 所 定义 的 . 

提示 ; 利用 第 一 章 例 4.2 和 例 4. 4 的 结论 。 


附 录 


(一 ) 定理 2.5 的 证 明 
如 同 定理 2.4 以 前 的 说 明令 


zh 2) 


于 是 
A Oo 12), |F| 一 1 一 站， 
1 一 
Eo= T 二 i {_, ， Y 一 9 VA 
以 大 


(BA) 一 


1 一 


从 而 Fly FL 的 联合 密度 为 
二 150 和 


1 pr (qu 一 2pa; 十 8 


ef 1 ta 二 et 人 


= ellsn 1) (lm 0) 3 3 Coa 一 qi) 3 


1 
. “xp|— Tr Con 十 #1 一 zea) | 


作 变 换 


一 《1 ss 

di = 《1 一 pr Yrs 
此 时 Fa ass sa Py) 了 一 2 «a 
由 此 可 得 (retsoit 的 联合 密度 为 


Hrsvaomr) = etiam 1 (lo— pA) 二 


横 一 C1 一 的 和 


L (1 一 四 4 
Cuvee ez 和 py 《eu 十 pr) + rom i 【 
为 了 求 > 的 密度 ; 员 须 对 miypas 进行 积分 "为 出 进行 多 级 数 展 开 : 
3 Sl 时 
exP{rpvnv2r) = 这 vy 
记 有 
1 


9) = e254 ~ ICI — pi) 
《13 式 可 写成 


和 于 下 上 nn ， vt ses 


Krys ta) fetr) bp 六 人 rn 
进出 
而 


『 th etri dis m atiy (2=1+1) Ci 1,2) 
[Dl 


男 一 方面 利用 *(3ys 一 1) 表达 式 和 古 稍 数 的 信 位 公式 ,可 以 求 得 + 的 密度 
为 . 


nC DY Le 
+mm 放 


2 Ts 一 2] -0 一 1 一 虽 扣 人 


‘Dr (ti). ey § 


fat 1 il 


.ar (+) 
2 


* 767 。 


{二 》 定理 2,8 的 证 朋 
为 了 求 出 Pssn 时 >? 的 分 布 ; 我 们 分 二 步 进行 
1) 说 4~ 画 s(n 一 1952) (n> ps2>0) 其 中 


人 
当 总体 揽 相关 系数 Pas0 时 ,下 面 证 明 : 当 4.， 给 定时 


本 一 - 因 了 
PP—1l1l—ni 


这 是 因为 当 4 给 定 后 按 第 三 章 定理 2.6 知道 


[4s~Ftp 一 15 一 PP») 


Ri = 1 A py 

县 与 (east 43) 相互 独立 ;其 中 5 一 一 On 
而 mi Np ArByT ds) CH = Zi * on) 
以 而 

三 

= Bd dy Tl AB = BAB 与 mi 狂 如 
由 此 

Dt [一 二 Sufi ep 一 154 一 Ps). 


2) 由 于 Ou = Ou 一 oo On BA Wn Oo ,Tr) 
所 芝 

BP AB~—~W Cs — 18.8) 如 BP'ALB~ (BTnB) " XC# Oo 1). 
宙 于 相互 = Er 一 Tu 人。 于 是 


4 
A 和 一 1 
Op tr 《 ) 


记 4w 一 上 了 人， 上 趟 可 改 为 v4-X(n 一 D， 由 Cs 一 D 密度 可 知 2 
的 密度 为 


8 一 Fe 全) 
2 
由 11) 知道 , 当 4;， 给 定 ( 即 和 4 给 定时 ) 


n—p 吏 | 
-FF 一 .下 一 A 
p11 Tir Cp 3 fA 


各 一 了 
4 ezP {- 二 ") C2) 


一 
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它 有 密度 C 见 第 三 章 员 .0) 式 ) 


KO) DT dT 


t= 
Bl -4 
2 一 Cs} 
[Gm p+ Crom Tt 
其 中 
着 ， 一 ， #5 
“7( | 了 
在 变换 
1 划一 让 Wr 
tl 圭一 上 
则 


J ) 一 > 三 上 《1 ww)? 


于 是 当 夺 给 定 层 w = P 的 条 件 密度 为 
(sD) 
NE) Da i ) = (4 


只 要 在 C4) 中 关于 有 积分 ,就 可 得 到 w = 眉 的 无 条 件 分 布 ; 即 “ 
tw) = | Nw, DC 


由 
LE) a) 
2 
_ I ( 可 = 1 + 中， _ py a Copy 


sw—1 
z GE 
这 里 利用 了 14* 一 人 开 人 一 1 一 下 
所 以 w 呈 六 的 无 笨 件 分 布 密度 为 
QB bp Ss 


Fd] 


二 IBF e 


(3) 


最 后 再 令 w 一 严 ，fo 一 池 ) 一 于 ;再 将 5 表达 式 代 人 即 可 证 得 本 定理 目 
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第 五 章 统计 假设 检验 


绕 计 假设 检验 是 统计 排 时 的 基本 问题 之 一 。 在 一 元 绕 计 中 ， 
对 于 正 态 总 体 N(p ,eey 的 参数 和 器 进 行 了 各 种 检验 ,作为 一 
元 的 推广 ， 本 章 主 要 介绍 多 元 正 坊 总 体 NN,Cp; 了 了 ) 的 假设 检验 癌 
题 ， $5.1~$5.3 是 介绍 正 坊 总 体 均值 向 量 的 各 种 检验 ，$ 5.4 是 
介绍 多 项 分 布 的 参数 的 大 样本 推 类 下 非 正 态 总 体 均 值 向 景 的 检 
验 , 55.5 是 介绍 正 态 总 体 协 方差 矩阵 的 检验 ， 


$5.1 协 方 束 阵 已 知 时 均值 向 冲 的 答 验 


一) 但 然 比 统计 最 

在 数理 统计 中 有 关 分 布 的 参数 的 假设 检验， 通常 旺 利 用 极 大 
似 然 原理 导出 似 然 比 统 计量 进行 检验 ， 在 多 元 统计 分 析 中 几乎 所 
有 重要 的 鼻 设 答 验 都 是 利用 极 大 似 然 原理 给 出 的 ， 因 此 在 讨论 其 
体 的 检验 问题 之 前 ,首先 对 极 太 似 然 原理 作 一 个 回顾， 

设 靖 维 总 体 的 密度 图 数 为 所 xz .9)， 其 中 6 是 未 知 参数 , 它 取 
售 于 会 数 空间 9， 又 设 有 8, 其 全 的 一 个 子 集 ， 我 们 希望 对 下 列 假设 

上 :BE 加 ， Hi:0¢@, C1.1) 

作出 羯 断 , 这 就 是 慢 设 检验 问题 。 我 们 称 H, 为 原 假设 , HH 为 各 择 
假设 。 

及 该 总 体 狂 立 抽 又 了 容量 为 着 的 祥 本 2 人 一 12) 记 
它 的 似 然 冰 数 为 


LCO) 一 Lx XO) 一 H ‘x18) 


引进 绕 计量 
6 s 


hm as tI1.2) 


显然 4 是 不 依 环 参 数 日 ,而 仅 是 样本 xxz。 的 函数 ,从 而 它 是 
一 个 统计 量 , 习惯 上 称 4 为 似 然 比 统计 量 , 由 于 如 C98， 从 而 0 志 
1411， : 

由 航 大 似 然 原理 知 , 如 果 14 取 值 校 小 ， 这 说 明 当 品 , 为 真有 时 观 
察 到 的 样本 xivzzy… yx 的 概率 比 品 不 真 时 观察 到 的 样本 x1， 
x 的 概率 要 小 得 多 ,此 时 , 我 们 有 理由 杯 又 慑 设 有 ,不 真 . 
所 以 从 位 然 比 出 发 ,(1.1) 的 检验 合 题 是 当下 式 成 立时 拒 扳 点 ， 

UR Xa 

其 中 如 是 临界 秆 , 它 是 由 始 定 的 显著 水 平 ", 按 Pet < 扫 加 sm 
对 一 切 6 & 8。 来 确 宝 的 ， 由 苞 可 见 , 要 想 确 定 le， 就 必须 求 出 似 
然 比 统计 景 2 在 假设 成 立时 的 分 布 。 | 

《二 》 章 总 体 的 情况 

设 x ,… ,x 是 取 岂 了 元 正 坊 总 体 Win) 容量 沟 # 的 洋 
本 ,其 中 居 为 拘 导 向 量 , 3 为 正定 的 协 方差 矩阵 , 且 为 已 知 的 ,我 们 
的 向 题 是 在 于 已 知 的 悄 况 下 ,通过 样本 和 ,xn 来 检验 总 体 的 
者 逢 向 量 是 否 等 于 事先 工 定 的 p,。 即 检验 假设 

如 :一 Hi C1.3) 

显然 ， 此 时 日 一 全 :pp 为 任意 的 了 维 实 向 量 } 8, = 人 :一 pp} 
侯 然 函数 为 
LR) 一 工 (Ex 有) 


一 《2r )- 二 1 下 -exp 二 二 BS) wi — EY) ECX; 一 oj 
Hur 
一 (ze 六 和 芝 1203em1 一 二 ef3C4HeCE 一 DC 一 7 


其 中 
-865 ， 


过 一 上 了 
好 it 


A— D(x — x; — a 


一 了 
` 由 于 已 知 ,LCp) 当 上 且 仅 当 在 pp 一 大 处 达到 最 大 什 , 即 
max L(p) 一 LOK) 


C2) exp{ 一 二 er 


而 
max Lp} 一 Lep,) 
- (2z) 管 131-jemp 1 一 上 6 
一 加 tf[ 天王 区 天 一 天 并 证 一 7 对 
于 是 伏 然 比 绕 计 量 为 ， 
和 mar LF) DI Te 一 玉 交 旺 中 
站” = ax 元 一 erp{ 一 本 tr[n 各 Hi 
= ep 一 去 谎 (元 一 中 人 互信 元 一 po)} 一 exp|— 1} 

其 中 

1 一 民 二 一 下 三 所 基 一 po) (1.4) 


绚 然 术 是 4 的 严 烙 单调 下 降 丈 数 ， 因 此 对 于 给 出 的 剧 落 水 平 =， 
ey) 就 等 价 于 4 守 i(a), 于 是 上 述 的 似 榴 比 统计 量 等 
价 于 4 统计 量 。 由 第 三 章 定 理 1.1 知 在 H。 汶 真 时 4 一 mn{ 环 一 
一 J) 一 好 人。 从 和 而 关于 《1.3) 的 假设 检验 有 如 下 定 
理 : 

定理 1.1 设 x,…:,x, 是 取 自 正 坊 总 体 舟 Cpys 了 的 样本 
(3 之 0 且 已 知 , # 之 的, 对 于 显著 水 用 x, 则 拒绝 (1.3) 中 原 假 设 


4167 = 


的 拒绝 域 是 

A nEO pH) ER pp) Xp) (1.5) 
其 中 姑 .。(p) 为 自由 度 是 了 的 如 变量 的 1-a 分 位 数 , 即 P {XCp) 声 
和 7)) 一 1 一 a 习惯 上 称 对 _。(p) 为 临界 值 ， 

检验 的 具体 步 又 可 归结 如 下 ; 

《iD 根据 样本 值 计算 样本 的 均 信 准 量 大 二 二 1 xi, 计算 已 
知识 方差 阵 5 的 道 炬 阵 也:， 然 后 代 人 统计 量 (1.4) 得 到 1 的 一 个 
上 其 休 值 ; 

《ii 让 给 定 的 吾 著 水 平 a, 查 自 由 度 为 了 的 六 至 求 得 临界 值 
好 -fp 

《iiiy 根据 Ci) 计算 的 4 值 是 次 满足 

nl 一 Fo) TF (Eo ho) Xt Cp) 
而 决定 拒绝 还 是 接受 不 假设 4H. 

当 拒绝 H, 后 ， 我 们 希望 利用 样本 均值 向 量 来 估计 + 的 取 

入 范围 ,为 此 考虑 不 等 式 

nEO pp) (1.6) 
由 于 zn( 对 一 JY37E 一 pp) ~ jp 因此 之 泣 足 (1.67 的 铬 率 是 
1-*， 对 寺 已 实现 的 样本 均值 商 景 诗 厕 音 {1.6) 式 给 出 了 一 个 天 的 
集合 , 称 这 个 集合 为 的 一 个 置信 区 域 ,置信 系数 为 1 一 ce. 此 区 域 
是 一 个 以 兰 为 中 心 的 酉 球 ,形状 依赖 于 3, 大 小 则 取决 于 疝 _(p》， 

三) 观 总 体 的 情况 

设 有 两 个 元 正 坊 总 体 N(R,2) 及 N,(p,2) 其 中 之 0 
且 已 知 , 又 设 和 ,和 ye ys 分 别 为 独立 取 自 这 两 个 
正 态 总 体 的 样本 ,有 这 两 个 样本 间 也 是 独立 扫 取 的 ,我 们 冰 感 如 下 
的 假设 检验 问题 


Hp = pp, Hnwy C1.7) 
显然 ,与 其 相应 的 参数 空间 可 写成 
9 一 人 pp):psp 为 两 个 任意 的 靖 维 实 向 量 } 
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Be 一 人 (有 2 
记 


! 5 Xi ! > 


J 


地 加 > Cx, 一 至 多 本 于 )， A. 3 Cy; 一 PICy: 本 PY 
此 时 侯 然 函 煞 为 
LRSp) 一 了 Kx 
一 Ge 


" exp [3 7 tly CA + 4)] 


一 守 tr 二 一 pF pY] 


一 2 tr[ 瑟 -到 一 2 一 7 了 
类 似 于 单 总 体 铺 部 可 以 导出 似 然 比 统计 重 为 


ep 


1 
一 sp| 一 二 对 
xp{ 一生 


1 一 - (x 一 5)YER 一 $) C1.8) 


如 1 十 
显然 ， 统 计 侨 2* 与 4 是 等 价 的 。 寺 于 下 与 了 相 五 独立 ， 所 以 
全 一 懈 Ne(F 一 ?和 训 2) 在 志 为 页 时 有 2 MO， 
从 而 检验 C1.7) 识 有 如 下 定理 。 
定理 1.2 设 和 取 和 育 正 森 总 体 Np 3), i "+ 
yx, 服 自 正 恋 总 体 Npbp,5) 的 独立 样本 ,其 中 六 0 有 已 知 , 对 于 
最 堵 水 平 @ 卸 稳 4i77 申 原 假 设 二 的 拒绝 域 是 


其 中 
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2 一 大 半 《是 一 有 7 了- 二 一 有 ) 六 栓 ( 的 (1.9) 
ni 十 部 . 


其 中 居 _(p) 清 忠 PE 所 告 (PD 一 1 一 aa. 
检验 步 又 与 (二 ) 相 同 。 
如 果 拒 怨 了 上山 , 即 认为 下 与 ?> 有 显著 差异 ， 我 们 还 希望 有 通过 
料 本 均值 向 其 来 估计 jp 一 ?的 范围 类似 于 (二 ) 中 的 讨论 ,Cp 一 
yx》 的 1-& 的 置信 区 域 可 取 为 
Hy Caw)"[(R 7) 
Le 十 开 
— (pC— Ep) C1.10) 
此 区 域 是 以 一 了) 为 中 心 的 一 个 椭 球 . 


$ 5.2 协 方差 阵 未 知 时 均值 向 盟 的 检验 


上 上 节 给 出 了 当 总 体 协 方差 降 已 知 时 总 体 均 值 和 测量 的 检验 问 
是 。 但 在 实际 问题 中 协 方 差 降 通 党 并 未 禹 道 ， 在 一 元 统计 中 当 方 
差 未 知 时 , 检验 均值 的 问题 采用 的 是 一 检验 靶 ; 即 检验 绕 计量 
服从 # 人 分布， 在 多 元 正 访 的 情况 下 ， 利用 似 然 比方 法 可 以 得 到 类 
概 的 Hotclling-T?* 统计 量 

(一 ) 单 总 体 的 情况 

设 xz， … :xs 取 自 ? 维 正 访 总 体 凡 pC,32 的 容量 为 natn 之 
护 的 样本 ,其 中 天 和 了 都 未 知 ， 且 王 > 0。 我 们 要 检验 该 总 体 的 
雹 值 向 时 是 否 等 于 已 知 向 量 py。, 即 检验 假设 

Hoop pms Hp (2.1) 

显然 ,此 时 8@ 一 {tp,3):p 为 任意 的 了 维 实 向 量 ,3 疡 站 ,一 
{Cp 2):H 二 #4; 之 吕 。 由 第 四 章 的 定理 1.1 有 


2 1 
9 一 也 3 一 
2 LE 
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其 中 
古 于 工 A- SY (zx — Ex, — EY, 


用 类 羽 方 法 可 求 得 


四 工 *) 
和， Llp,3) 工 (po 人 4 


其 中 


A Dx ROCX; — po 


一 4 十 起 元 一 p(T 一 站 
于 是 似 然 比 统计 量 为 


1 
14 十 二 站 一 pe)( 天 一 1 
注意 刘 分 块 矩阵 的 行列 式 公 式 , 我 们 取 行 列 式 
4 WV za (是 一 "| 
一 We (二 一 pu) 1 
|All+ nx pp AX pe)| 
一 | 有 十 nC 主 一 pp)( 于 一 poy7| 
由 上 式 中 的 后 一 个 等 式 可 得 
|4| . 
[4 十 HC 一 po CE 一 po) | 
= [1 ni pA Rt! 


所 以 有 , 
2 (+ mp) A NR pp) T 


2 -于 
一 1 二 -一 一) 


ss—1 
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其 中 
T= nn — DC — ph) ANCE — po) (2.2) 
《2.2) 正 是 第 三 章 中 讨论 的 Hotelling 的 了 T! 统 计量 。， 而 4 是 TI 的 
严格 单调 下 降 函 数 , 因此 1 志 4(a)》 各 当 于 7? 之 Ta), 由 第 三 
章 定理 31 知道 在 H; 为 真 时 有 
革 一 和 户 » T? 
p 大 一 1 


~ Fpn— Pp) 


于 是 有 
定理 2.1 议 x1,-…, Xx。 是 取 自 正 态 总 体 入 ,Cpy，3) 的 样本 
《2 > 0,5 之 区 上 攻 中 情 看 卫生 末 知 ,对 于 显著 水 平 , 拒绝 (2.1) 
中 原 假 设 纪 的 拒绝 域 为 
Tr n(n — NF— pa) A KR po) > To) 
— EF (pn ~ p) (2.3) 


其 中 Fp,n 一 P) 是 第 一 自由 度 为 p， 第 二 自由 度 汐 # 一 了 的 
F 分布 的 1 一 2 分 位 点 ， 

例 2.1 对 20 下 健康 女性 的 汗 术 进行 化 验 ， 数 据 列 在 表 2.1， 
其 中 必 一 排 汗 基 , x; 一 汗 术 中 钠 的 含量 , x 一 汗水 中 钾 的 售 是 ， 
为 了 探索 新 的 诊 斯 技术 ， 需 要 检验 假设 Hs:p 二 (4,50,10》， 显 
著 水 平 = 一 0.19， 并 设 《zzasty ~ NCp，2)，p， 了 都 未 知 . 


表 2.1 20 名 妆 性 的 汗水 化 验 数 据 


试 者 序号 | 1 2 3 4| 5 6 7 8 9 | 10 
=， 3.9| 57| 3.3| 3.2| 3.1| 4.6| 241 9.2| 69 | 5.4 
En 48.3 | #5.1 | 47.2 | 53.2 | 53.5 | 35.1 | 24.8 | 33,.1 | 47.4 | 54.1 
x 93| 8.0| 109 0 12.0| 9.7| F9114-0| 7.6| 85|11.3 

”一 一 

试 者 序号 | 11 12 13 
+ 3.9| 4.5| 5.5| #5 | 131 8.5| 4.5 6.5| 4 5.5 
zy 36.9 158.8 37.8 492 |13.5| 56.4 -6 53.8144-1 | 40.9 
2 12.7 | 12.3. 9.81 8.4 |101| 7 g.2. 10.9 | 11.2| 9.4 
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生 壶 2.1 的 数据 可 计 敬 得 
"4.640 2.879 10.002 —1.810 
一 [ae ,A—19 | 10.002 199.798 on] 
,9.965 -1.810 —5.627 3.628 
0.586 —0.022 0.258 
4 一 上 。 [ee 0.006 ”一 002 
0.258 —0.002 CG.402 
将 它们 代 人 统计 量 (2.2) 得 Ti 一 9.74, 对 于 a 一 0.10,， 瓷 自由 谋 


{Pn 一 六 一 《3， £17) 的 三 表 得 Font3,17) 一 2.44， 而 区 0.107 一 
19 XxX3 19 XxX3 
17 


1 Fomnt3,177) 一 一 一 一 X2.44 一 818. 显然 ,天 一 974 之 


8.18 一 了 200.10), 于 是 以 绰 获 水 平 0.10 拒 绝 9,。 
如 果 措 绝 了 吕 ,， 我们 还 可 以 由 给 定 的 样本 来 伍 计 总 体 均 值 向 
量 # 的 1 一 上 置信 域 。 对 于 给 定 的 显著 水 平 有 
P {a CR YA py 
< DP pp,n— pb)} 
?了 . 


一 P 一 站 AT 二 一 站 
< Pp 一 5 一 二 一 你 
所 以 上 & 的 1 一 0 置信 这 域 为 
yA Pp (pn 
(FF— uA Eo pp) 7 —p) alp ?) 

它 是 一 个 以 对 为 中 心 ,形状 依赖 于 4 的 精 球 . 

在 构造 均值 向 量 py 的 置信 和 区域 时 ,在 应 用 上 更 需要 考虑 jp 的 
各 个 分 量 上 ij 的 问 了 时 置信 区 间 (Simultanequs Confidence [Inte- 
frvals) 问题 。 设 x ~ N,Cpy,23), 考 菩 线 性 组 合 


x= nt 
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其 中 上 为 在 意 的 菲 懿 乡 维 实 面 量 。 由 第 二 - 章 定 理 21 知 六 
NOPE) 设 一 12 为 正 森 总 体 六 8) 的 样本 ， 
相对 应 于 = 的 样本 为 
下 一 
. 且 祥 本 的 均 人 入 和 补 样 本 方 莽 分 别 为 
Elis, disl 
其 中 元, 是 样本 xpi 呈 1,23,-…*s# 的 样本 沟 值 向 量 和 样本 胁 方 
差 阵 ， 
对 于 尾音 的 [根据 了 yp 的 置信 区 间 能 句 得 到 所 要 的 同时 置信 
区 间 、 事 实 上 ,于 于 任意 辕 定 的 | 和 未 知 的 党 一 了 3 由 一 元 统 
计 知 道 基于 于 统计 量 的 gs 一 了 p 的 1-t 置信 区间 为 


. Es 
下 下 一 站 a st) MS er 
a ye F 


. YP 
< 十 tn 1) sr 
车 取 一 0005150,，*,0), 则 1 的 第 i 个 分 量 为 1 其 余 分 
量 回 为 46， 则 Lp 一 Pi， 上 式 即 为 第 了 个 分 量 pi 的 1- 4 置信 区 
问 。 显 然 , 选择 不 同 的 [就 可 以 得 到 pp 的 不 同 线性 组 合 的 1-0 淖 
信 区 闻 。 但 需 注 意 ,对 不 同 的 ,fa 同时 落 人 各 自 的 1-“ 置信 区 
闻 的 总 置信 度 就 不 再 是 1-e， 而 要 比 1~ 4 低 。 为 了 保证 总 置信 和 度 
不 小 于 1-a* 下 面 介 绍 Scheffe 构造 同时 置信 区 间 的 方法 。 

对 于 给 定 的 样本 xi 一 1,2，*……s# 和 固定 的 【置信 区 间 


[a :一 1 全， [+t ss — 1). 5 ] 
是 使 


— Lt (XO— HF 3 
F ss < ,nl) 


上 成立 的 全 体 【pgp 值 的 范围 。 为 求 Ly 的 局 时 置信 区 同 , 我 们 设法 
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导 找 一 个 与 上 无关 的 统计 量 Ye) 使 对 于 所 有 二 均 俏 
2 TC) 


然后 由 T(x) 的 置信 区 疗 来 求 得 Ak 的 周 时 置信 区 间 。 这 就 导致 
了 求 妊 的 最 大 值 : 


max f= max [一 各) 和 
! { Est 


由 第 一 章 定理 313 有 
毕 [ 亿 着 — oo = a a Tl 
max PT nC SF 一 p=7T 


注意 上 式 中 5 为 样本 协 方差 阵 即 
《一 13 一 > [| 
对 二 给 定 的 a« 当 
Tr na— pS (Ep) < ET ppn — ?) 


了 时 就 意味 着 对 一 切 上 省 
"lis— tpl < Pielpsn 一 站 


3 戎 一 
即 对 一 切 ! 有 
rx J DP p, (psn — p) /3 <ip 
np 


Stet ep) ， VE 
或 者 说 对 所 有 ,区间 
上 


检 必 抽 


于 十 zz 一 1 Fl_APsn 一 pts | : 《2.43 
nln CO— Pp) 
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包含 Pp 的 松 率 为 1-g。 为 了 方 侯 , 我 们 将 民间 全 4) 称 为 天 -区 
闻 。 车 依 序 取 =O 0 = C0,1,0,. "st 
《0:0; ,0,1), 就 可 得 到 pp 的 所 有 个 分 茵 pi 的 置信 典 为 1- 
的 T?- 区 间 

| = 一 = Fistpsn — Pp) siis 


RC 


= pin— 1) _ 
5+ "=D. Flpon ?)* | (2.5) 


其 中 为 主 的 第 i 个 分 天, 5 为 5 的 ,站 元素。 类 似 地 取 六 一 
《0 00 0 其 中 1 一 lt — —bt < 天 ， 
去 一 2 8)。 此 果 了 2 一 于 一 2 十 5 我 们 就 得 到 所 有 
(pi 一 2 的 置信 和 度 为 1-< 的 天 -区 问 


| id + Ee pan — Ps — 2 + ta) 
(2.6) 


在 实际 应 用 上 我 们 常常 对 为 数 不 多 的 同时 置信 区 间 感 兴趣 ， 
在 这 种 情况 下 ,我 们 可 能 得 到 比 到 -区 间 更 好 的 结果 ,事实 上 ， 我 
们 考虑 严 个 线性 组 合 pyi 一 1,2,-…,tm， 且 六 园 小 ， 现 在 要 构 
造 这 严 个 线性 组 合 的 同时 置信 区 间 , 利 用 Bonferroni 概率 不 等 式 ， 
设 Bi 一 1:2: 到 为 下 个 随机 事件 ， 且 PCB8i 一 工 一 上 局 贡 有 


(A (Ae)-() 


d=l 


21 PPB Da 


t=]1 


对 于 每 个 :+ 区间 加 
E70 Cn 本 1 ” 9 i 2 
了 除 
其 中 心 一 二, 令 
Li 
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8,— {ne [a 士 6- a 《ma 一 17- 中 


刚才 PKB 一 1 一 生 。 由 Bonferroni 不 等 式 得 到 ( P B.) > 


1 一 a。 特别 取 光 二 P 就 可 得 到 均值 向 量 的 个 分 量 pi, i = 1， 
2,"… Pp。 的 1-# 同时 置信 区 间 


[sz G9 — De el] i 1,21 op (2.7) 


例 2.2 在 例 2.1 中 康 息 设 旧 ,在 a 一 0.10 下 被 拒绝 ， 此 时 我 
们 利用 [2.7) 式 容易 求 得 my pai 的 0.95 Bonferroni 同时 置信 
区 间 。 事实 上 , 若 取 «一 i 一 1,2,3, 因 为 # 一 20， 记 以 查 
:分布 表 得 

th Cl9) = fy.om7rC 19) mm 2.625 

青 利 用 例 2.1 的 计算 结果 便 可 得 到 0.95 同时 置信 区 间 为 

3.64 < pt < 了 64437.10 < pr 13.70,8.85 < ps S11.08 
Bonferroni 辣 时 置信 区 间 为 


| +a (一 DY i 12 (2.8) 
Ym 


它 与 71- 区 间 (2.4) 具 有 相同 形式 , 则 都 是 以 8 为 中 心 的 一 个 区 
章 ,它们 之 间 的 长 度 比 为 
Bonferroni 区 间 长 _ he #1) 
了 “区间 
区 闻 长 Pa 一 1 FI (Pp, 一 p) 

它 不 依赖 于 统计 量 志 和 8$ 对 为 数 不 儿 的 呈 个 py，Bonferroni 区 
间 总 要 短 些 。 震 2.2 对 菏 些 # 及 声 信 询 出 了 两 者 的 长 度 比 值 ， 

《二 ) 具有 等 协 方 交 阵 观 总 体 情 况 

设 2 Xo， 和 yy。 分 别 是 取 自 总 体 NCps5) 和 

"1?7 + 


家 3,2 Bonferroni 区 间 与 辣 - 区 间 长 度 比 


4 a .5 -5) 


~ 人 
~ 
~ 2 4 10 
比 人 ~ 
开 . 慎 各 
~ 
1 ol | i 
15 EH .59 0.29 
23 0.90 0.753 全 ,4 
$0 .21 0.78 全 ,5 
100 D9 D.80 0.62 
ce 机 人 | .81 | 全 
i ! 


总 体 Noly,X) 的 样本 〈m > psn > p) 其 中 了 > 0 且 未 知 ， 两 
个 样本 相互 独立 。 考 虑 如 下 的 检验 假设 问题 
:之 (2.9) 
类 似 子 前 而 ,用 似 然 比 方法 可 导出 检验 统计 最 
五 一 Cm + nm- RFR— YA Ry) (C2.10) 
Bd 十 
其 中 
sl Sx 了 一 十 Dy, 


m1 塌 ? 玫 虽 当 


A A A Dx — Rx ay 


十 > Cyr— Py — FY 


当 于， 为 下 时 ，T? ~ 全 人 pp, 壤 十 场 一 2), 由 第 三 章 定 斑 3.1 有 
六 十 2 一 一 l TT mv 六 一 
ey Ti~ Fpmn+m—p—1) 
于 是 有 如 下 定理 
定理 2.2” 设 xi ……:x。 到 向 正 态 总 体 NN,(pj,3)》 的 样本 . 
y 4，…… ys， 取 自 正 态 总 体 Ne(y。3) 的 样本 《3 > 0 且 未 知 : 


3 178* 


A 


a 


#1 > ;982 之 了)。 商 伞 本 相互 旬 立 。 对 于 显著 水 于 & 其 拒绝 2.37 
由 党 假设 i 的 拒绝 域 为 
te yy A(z 一 到 
FP, 十 一 一 1) (2.11) 
当 拒 绝 了 Ho, 相 应 地 一 yw 的 1- 置信 区 域 是 
Ce 二 着 一 产 一 二) 站 和 9: _ 
2 3 [x — y) 
— RAE Oo 3 Cp »)] 
Fp 二 (1) 
它 是 以 ( 主 一 了 了) 为 中 心 的 一 个 椭 球 ， 
例 2.3 荣 小 麦 品种 在 甲 、 乙 两 地 进行 试验 ， 六 分 别 招 取 了 
27 个 植 牺 观察 ， x 一 收割 时 植株 的 高 谋 ，x, 一 有 效 分 昔 数 是 ， 
x 一 每 村 棋 平 均 策 长 ,x 二 每 10 竹中 结实 的 小 穗 状 花 序 的 数 月 ， 
zx 一 每 10 和 巧 的 粒 数 ，x 一 每 10 和 蕙 的 粒 重 。 条 户 车 察 两 地 的 平 
殉 产 量 是 否 相 间 , 即 pp 一 上 是否 成 立根 据 所 观测 到 的 数据 分 别 
计算 得 样本 平均 问 量 及 样本 协 方差 阵 : 
EK' = (84.89,186.30,9.74,13.46,304.37,13.63) 
Bo 77.14,167.19,10.46,13.10,361.56,14.76) 
A= A+ 4 
1143.07 
57.40 3.84 
70.16 4.25 25.54 
79.48 0.6 和 23.62 326.56 
15.28 0.77 1.19 2.40 0.30 
21.60 1.04 2.56 4.14 0.39 . 0.83 


朗 两 个 六 元 总 体 为 正 态 总 体 且 有 相同 的 让 省 协 方差 阵 。 根据 
C2.11) 或 计算 得 


"i179.* 


Co 一 [如 3 “sl 天 一 
pr (zs— FYA 53) 


47 X27 x 27 
§ X54 


= 32.77 

对 于 一 0.01 查 自 由 度 为 (pom pO 一 了 一 1)= {6, 47) 的 三 
分 布 表 得 Pogp(6,47) 一 3.21, 粥 然 32.77 汪 3.21， 所 以 两 正太 总体 
的 均 信 向量 有 显 落 差异 . 

类 似 于 单 总 体 的 情况 , 当 拒 绝 了 部 后 在 实用 上 我 们 更 感 兴 趣 
的 是 两 总 体 均值 向 量 差 一 ”的 分 量 的 同 冉 置信 区 问 。 

设 xx 一 AM) ~ NE 0 未 知 )， 落 读 线 性 组 
合 vz 一 x 和 wr 一 2y, 4 为 任意 非 零 ? 维 实 应 量 ， 设 xi(i 一 
1:23 1 利 yi(i 一 1,2,*;72) 分 中 为 两 总 体 的 样本 ， 它 们 
的 样本 均 入 疝 量 及 样本 协 上 方差 阵 分别 记 为 


4 一 一 上 学 yy 


1 Hi i=1 


* 0.3099 


5 一 人 一 


Y， 《Xi — (Cx; 一 元 了 


#1— 1 pr 


sD 


#1 zi 1 jc 
相应 于 # 和 w 的 样本 均 入 和 样本 方 莽 为 z= 二 x,w 一 [和 站 一 
Sidi= 5, 令 
+ 4 
和 证 提 一 2 可 十 有 一 2 
那么 34 的 估计 为 【SL， 对 于 给 定 的 =, 由 一 元 统计 知道 , 壮 僧 


$= (A— A 4,) 


| ec 一 用 + 十 让 一 2): (人 上 上 
旦 使 
。150 。 


2— RT Sn nt — 2) 
(+ + )esl ’ 
Ll 并 2 


成 立 的 全 体 LCp 一 2 值 . 让 1 变化 ,完全 相 类 似 于 单 总 体 的 情 
疯 有 
max RF) — Tp) 


EE 
= {C(x — 5)— Cp rv) [人 十 +) s| 
* LE 3)— Cp — pl] 


ET 
1 十 入 
AE $F)— {p21 
= TT | 
对 于 给 定 的 «及 一 切 非 零 1 便 可 得 到 Cp 一 95) 的 1 一 4 同时 置 
信和 区 间 ( 即 T?- 区 间 ) 汶 


[re 一 她 二 jr (+ + 上 ) s1 | (2.12) 


加) 天 2 
其 中 


= (mT 二 一 20P F 十 pp— Dt 
c [二 十 风 一 一 1 1_aC 产 ;加 1 | 


特别 取 下 一 C0,…,0,1,0,-，*,0), 即 下 的 第 1 个 分 量 为 1 其余 
全 为 0, 则 Cp 一 pCi 一 12,……P》 的 -区 间 为 


[ca — #7) + +) (2.13} 


其 中 EE 分 别 为 误 利 S 的 第 i 个 分 收 ， 如 同 (2.12) 中 的 Pe Si 为 
3 一 《而 十 41 十 和 一 2 的 人) 元素 。 读者 不 礁 自 己 去 推导 
出 Cp 一 2 一 1,2,.…*,p 的 Bonferroni 同时 置信 区 癌 汶 


» 181 ， 


-~ ~ 


[Ge 一 3 十 (看 十 而 一 20。 {I 十 工 )o| (2.142 
tp He 


ry 
例 24 在 例 2.3 中 不 假 设 被 拒绝 。 对 x 一 0.05 利用 (2.14) 
可 求生 【ai 一 2 一 1 2 6 的 0.95Bonferconi 同时 置信 区 
闻 。 这 里 了 一 6, 一 各 一 27, 由 分布 表 近 似 地 得 到 
tam (532) 一 bel52) ~ 2.60 


芋 和 根据 酌 2.3 中 Eis 及 ssi = 1,2 1 的 数据 计算 得 到 
一 16.18 < m 一 切 < 3T1.08， 17 72 一 v20.50 
30 pO vy 3.30, 一 12.43 < ps 一 到 13.15 
一 37.58 过 站 一 证 扫 一 和 8， 一 177 < 1 一 拖 委 一 0 4 
由 上 面 的 置信 区 癌 可 看 出 ， 两 总 体 雹 值 向 量 的 第 一 .三 .四 分 量 之 
问 的 差 的 置信 区 闻 其 上 限 为 正 , 下 限 为 负 , 即 它们 的 置信 区 间 包 含 
零 . 办 此 对 于 这 三 个 分 量 不 能 断定 它们 不 四 等 的 ， 可 分 别 对 它们 
用 一 元 检验 方法 帮助 推断 ,但 对 于 例 2.3, 我 们 认为 py 六 主要 
荐 第 二 .五 .六 分 量 有 显著 差异 。 
所 三 ) 具有 不 粗 等 协 方 差 阵 双 总 体 情况 
设 总 休 ~ NoPE，21) ,总 体 和 一 Ne{p, E21), PA 
0 了 3 拓 3 且 都 来 知 . 设 x 和 yo 分 别 为 这 
两 个 总 体 的 样本 , 且 两 样本 是 独立 的 , 检验 的 起 设 癌 题 与 (2.97 相 
后 , 
首先 著 虑 和 一 和 一 的 情况 。 由 于 样本 容量 相等 ， 经 随机 
化 处 理 就 可 用 成 对 比较 的 方法 。 令 二 xi 一 pi 1 一 12 
划 z; 可 视 为 来 自 尹 元 正太 总体 N,Cp 一 293 十 2) 的 样本 ， 上 
述 的 检验 问题 就 化 为 给 验 假设 :一 一 0 于 :8 一 了 夺 0. 这 
正 是 本 节 ( 一 ) 所 讨论 的 精 况 ,检验 的 统计 量 为 
T= p(n — lz A i {215) 
其 中 


加 一 二 Zz 一 二 2 xi — ¥) 


=。 182. 


4 一 (zi 一 四 (zi 一 人 


i 二 1 


其 次 考虑 二 | 7 二 的 情 沈 ， 不 辣 设 大 <- 1 令 


于 是 


一 圭一 V+ 二 »— pmp—v 
Vi 2 


GOT[KZi zi) 一 E(z; 一 Ez)(z; 一 Ex;) 


一 EE (Ne C+ 


oo) -Dy | 


其 k=1 


元 本 


.Or 一 中 一 二 补品 


二 Ha k=1 

2 2 

21+ 8a Tt 本 
2 3 

一 29 -但 : 


本 HW 十 1 
#3 #1 Ny = 1 


ul 十 所 5,) 
#2 


二 


* T8333. 


由 此 可 知 as 一 12 相互 名 YA, 自 2 ~ Ns(p 一 2 十 
弄 . 5 )。 这 时 的 检验 问题 仍 转 化 为 (一 ?所 讨论 的 情况 ， 检 验 统计 
最 为 
其 中 


TY (Hi — 有 4 (2,16) 


至 一 上 3 Zz 4 一 > 《zi 一 二 LZ 一 三》 


本 节 中 所 涉 上 莽 的 检验 并 计量 都 是 Hotelling 的 统计 最 ,这 
个 统计 量具 有 一 些 优 良 的 性 质 ， 首 先是 在 非 奇 演变 痪 之 下 的 不 变 
性 ， 例 如 , 设 总 体 x 一 和 NH) ,Xs，-…,X*。 为 其 样本 ,检验 假设 
Ho 一 py 源 jo 检验 统 计量 为 T? 一 n(n 一 1 一 p》 
用 区 一 ww) 考虑 变换 y 一 Cx 十 d, 其 中 CC 为 PX 了 阶 非 党 冤 
阵 ， 如 为 请 维 实 周 量 。 由 多 元 正 态 分 布 的 性 质 下 了 一 NCCp 十 
,CZC'), 相 对 应 于 x; 的 样本 汐 3 一 Cx 十 d,i 一 1,2,''* 9。 
对 总 体 x 的 上 述 检 验 假 没 等 价 于 对 总 体 了 作 检 上 验 乱 设 名 :ay 一 
;Hi 到 KP 这 里 的 py 一 Cp 十 dp 一 Cp d， 记 


了 一 土 yi 4 一刀 (y; 一 了 D(y; 一 了 》， 从 而 有 检验 统计 


Tan DF pHY AYF — Fp 
不 难 推出 
To To pn (FT po) A N(R po) 
这 就 是 非 音 异 变换 下 的 不 变性 ,因此 进行 TY? 检验 时 可 事先 对 数据 
进行 坐标 平移 . 许 转 变换 ， 这 痢 不 影响 检验 结果 。 此 外 天 检验 还 
具有 一 致 最 有 效 性 ,可 容许 性 等 性 质 , 有 兴趣 的 读者 可 参看 [8] 的 
3 了 7 了.2。 


“5.3 均值 向 量 的 子 向 量 检 验 
前 面 两 节 是 讨论 正 态 总 体 的 雹 世间 盐 王 本 的 各 种 检验 问题 ， 
"134， 


杰 节 是 证 论 应 六 总 体 的 均值 问 量 的 于 向 量 答 咏 癌症 。 

(一 ) 淘 慎 南 蜡 对 称 性 梳 验 

设 总 体 x 一 NE,E) 其 中 了 > 0 未 向， Xn > 记 》 
为 该 总 体 的 样本 。 所 亩 均值 站 好 对称 性 的 检验 是 指 检验 和 的 8 
个 分 量 是 否 相 等 , 即 检 验 假 设 

Ho pi ps Hi: pi 不 全 相等 (3.1) 

其 中 iki 1 2+* ,Pp) 是 时 第 个 分 重 。 

为 了 棕 紧 53.17 .我 们 引进 对 照 所 阵 的 概念 . 令 1 一 (1 1 
17 称 满 足 Cij 一 8 的 (P 一 1) Xxz 阶 有 旦 秩 为 ?一 1 的 姑 阵 C 为 
对 赂 垂 阵 ,例如 


1 -1 0 0 -1 1 0 0 
cml 0 一: ,Ce oi 
1 0 0 一 】 心 0 0 一 1 1 
(1X27$ Cx2y! Dp Cs 0 
Cm (2x3) 从 2x3) 人 一 MK2 x 3Y 全. ”0 ] 
tp 一 DT tp — ppl [Cp ~ 1).p] 3 ce 一 De 二 be 


都 是 对 照 秆 阵 , 币 且 和 还 是 正 交 的 ， 容易 看 出 检验 53.17 等 价 于 
检验 


Hcp 0 HCp¥ 0 (3.2) 
或 检验 
Ho: CR 0, HOR 0 (3.3 
注 半 到 对 于 任意 的 《7 一 1 Xp 阶 对 照 和 攻 CC 和 Cis 必 存 
在 (Pf 一 1) XX (tp 一 1) 阶 可 递 短 阵 8 使 得 C: 一 3C。 事实 上 ， 
将 Ci 和 Ga 划分 为 
Ci 一 (Mr Ci 一 (8950 
其 中 Mi 和 机; 分别 为 CC, 和 5; 前 ?一 1 列 组 成 的 (pp 一 1) Xx 
(2 一 1) 了 脐 粳 阵 ，m, 和 iti 分 别 是 C 和 Ca 的 最 后 一 列 ， 卫 不 彤 
没 ， 
了 5。 


rkf ay 一 Tkafy mrkC 一 TIkCC = pp—1 
取 8 一 MMi', 则 有 于 一 Ba 又 Ci 为 对 照 阵 ,所 以 


1，， 
cy 一 (Momo( 一。 


从 而 mm 一 一 1 类 概 地 有 坊 记 一 Milo 且 坊 一 
一 Ma 一 一 BMt = Bm; 所 以 
C=— (Mm) = (BML Bm) = BC 
上 述 和 的 讨论 说 明 我 们 考虑 的 对 称 性 检验 假设 可 通过 任何 一 个 
对 照 扎 阵 C 表示 为 


HCp~m0, Hcp (3.4) ， 
显然 Cxili—1,2, “ “3 仍 独 立 , 且 每 个 Cx~N, Cr, CEC'), 
这 样 , 检 验 假 设 (3.4) 又 转化 为 上 一 节 ( 一 ) 中 的 问题 。 检验 统计 量 
为 


Ti nn — 1)(CAYCCAC') (CE) (3.5) 
其 中 


zm yx A Tx Rx RY a 1):s 
Le 


i=1 


例 3.1 考查 某 地 区 土壤 中 不 同 深度 的 铅 的 含量 是 次 相等 .将 
土 囊 按 一 定 标准 分 为 三 层 (表层 .中层 和 下 层 ), 第 ; 层 铝 的 含量 为 
vif 一 上 23 和 肖 2 一 CxX1 3 ~ NE; 互 )。 要 检验 p 的 三 个 
分 量 play 和 pn， 是 否 相 等 。 我 们 选取 对 照 蜡 阵 为 


一 1 D 
c-{ )， 
0 一 ] 1 


观测 了 * 一 50 个 点 , 即 获得 容量 为 30 的 一 个 样本 ,计算 出 Cx 的 
妊 本 均值 和 协 方差 阵 为 
CR (13.5,9.7Y 


i ~ 6.8! 7.62 
csc 一 二 cac 一 人 ) 
机 


7.62 11.34 


" 186， 


0.08490 .05606) 
0.05606 0.12367; 
代入 C3.5) 和 的 了 :统计 量 得 7 一 621.36。 对 于 ww 一 0.01, 查 自由 度 
为 (PP 一 1,z 一 十 1) 一 (2,48》 的 FF 表 得 
Fo 2,48) 一 5.08 


《edC 1 一 49 (_ 


Taz(0.01) 一 1 F, oo 2,48) 


X25.08— 10.37 
显然 T! 之 TX0.01), 从 而 拒绝 H。 即 认为 土壤 各 层 坷 铅 的 含量 有 
《二 》 均值 向 量 的 子 向 量 等 于 某 书 知 向 量 的 检验 
设 xz Xe 是 正 坊 总体 WIRE 之 08 滨 Pp) 的 样本 ， 
权 和 了 都 未 知 ,将 pg 和 3 划分 为 
相 CE) 
En Du 
< 一 Ge 5 ) 
其 中 出 为 rf 维 册 为 二 了 一 + 维 . 为 fr Xrf 阶 ,Fw 为 sxX 
了 阶 ，Z6 为 ? X35 了 阶 ，Z211 一 Zwy， 我 们 要 检验 假设 。 


(人 
此 时 


日 一 {Cp 了 ) :8 为 任意 乡 维 实 向 量 ， 卫 > 中 
多 一 {PE 一 《机 任 意 , 卫 盖 中 
将 祥 本 作 相 应 地 划分 


{1 


x, 一 (，)， 其 中 x 四 为 7 维 ,x 六 为 :一 了 一 ! 维 
xX" 
fm 2 


187 。 


祥 本 平均 及 A 一 了 (xi 一 工 )(xi 一 式 ) 的 相应 划分 为 
f=1 


十 全、 A ALs 
一 (ea 4 一 ( 4 ) 
由 第 二 章 多 元 正 态 变量 过 缘分 布 性 质 ,可 将 x9i 一 1,2，*…，#, 看 
成 生 颖 正 态 总 体 Nayza) 的 样本 。 利用 我 们 获知 的 似 热 比方 
法 可 导出 似 然 比 统计 戌 为 
+ 一 [1 十 外 [二 人 一， pa An!' CE 一 pp 

它 等 价 于 统计 量 

1 一 了 : == (Cn 一 i n(x 一 了 《是 一 8 ) 《3.7 
将 43.7) 与 (2.2) 相 比较 便 可 得 到 如 下 结论 。 

定理 31 语 


x 
xi ) i] 2+ 
x 


‘2) 
下 


是 从 NpCp,>》 中 抽取 的 样本 ，(3 > 0， 且 未 知 ，z > 区 其 中 
xf 为 1 维 ，xi? 为 一 了 一 ?+ 维 ， 


[a Zu Su 
A 网 “一 人 2 
那么 答 验 假设 《3.6) 的 极 大 似 然 检验 可 篇 化 为 下 述 它 的 相应 子 向 
量 的 极 大 似 然 检验 ， 


设 Xt 一 1,2,*"*,n 是 了 ==- 上 让 一 站 维 正 态 总 体 NL, 了) 
的 样本 ,相应 检验 假设 为 


Pa 一 pO, Hip PY (3.8) 
其 拒绝 城 为 
和 一 《一 1 一 0 二 9 一) 
> Ta 一 起 二 1 polssn — s) (3.9) 


本 节 ( 一 ) 中 所 讨论 的 对 称 性 检验 ， 实 际 上 可 化 为 子 向 量 的 检 
83 ， 


验 问题 ， 事 实 上 , 设 C 为 (9 一 1) Xp 阶 的 对 照 陈 , 令 
1; 
p=- (2) 
显然 也 是 满 秩 的 了 Xp 阶 算 阵 , 设 xi 一 1. 2 9， 是 总 体 
PP) 的 和 衬 本 , 令 Jr 一 下 xi 923 旭 Fi ~ NoCh, 
主 ) 县 让 互 独立 ,其 中 
~ Lp /lsl, 13C’ 
rT Pr (02) 7 DED ~ (ea csc) 
与 对 称 性 检验 假设 (3.4) 比 较 , 可 看 出 (3.4? 正 是 对 正 态 总 体 NC， 
盏 ) 的 均值 向 量 下 的 子 向 有 量 Cp 是 否 等 于 零 的 检验 。 
(三 》 均值 向 量 的 部 分 子 向 是 已 知 ， 其 它 子 向 量 等 于 某 个 党 
向量 的 检验 
设 Xs 是 从 正 态 总 体 NCH, TD >0 未 知 ， np) 
中 抽取 的 样本 。 均值 向 晤 pg 和 协 方差 阵 了 有 外 向 (二 ) 中 的 划分 . 
我 们 要 检验 假设 
i, MY yg, pi pi 
Hy: 1 = (Gaj = pv HH: je ) 过 人 《3.1073 
其 中 gp? 是 天 的 > 维 子 向 量 且 为 已 知 的 ，pim 为 指定 的 :二 ?一 
r 维和 馆 向 量 。 此 时 


Mi 
= {Cp 2):p: = PB， 任意， 一 人 ), 时 > 时 
~ Fi 


ro 
@,— {ps 3p — pm (to,), 7 >0} C3.11) 
Mn: 


如 果 令 y 一 x 一 p99， 则 y ~ Me( 下 了) 其 中 站 一 天 一 那 
去 (3.10) 可 转 作 为 丙 : 首 一 0, 用: 下 闪 0。 因 此 为 了 后 面 的 论证 及 
都 述 方 便 ,不 妨 先 假定 pm 一 0, 此 了 村 (3.11) 就 可 和 相应 地 改写 为 


8 一 {Cn, 互 ) :下 一 人) 任意 ， 互 o} 
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和 一 《Ca 37 一 0 了 0 {3.12) 
利用 做 然 比方 法 得 到 统计 量 


1# 一 ( 1 + ne A ) _ ( 1 ) 
1 + na A 


它 等 价 于 统计 县 
1 十 nA 
1 十 yA 
下 面 我 们 要 她 出 1 一 1 在 给 定 2 及 4 之 下 的 条 件 分 布 ， 
相应 之 下 的 检验 称 为 条 件 答 验 ， 
根据 第 一 章 第 二 节 分 天 逢 降 的 求 送 证 明 中 有 


A (2 a) 上 ( A 0 站 { 0 
"An da 1 0 0 一 4 1 
. 着 :如 
其 中 4 一 A 一 AnAmAn， 对 于 三 一 (as 有 


A 下 = 《 寺 2 一 AnATEYVY A CF 一 | 
+ A 


A (C3.13) 


从 而 
711 HE A A (RY 4, AmRdY (3.14) 


1 十 nx AnlE 


由 于 参数 空间 @' 中 子 向 量 jw 一 0, 再 根据 正 态 向 量 的 条 件 分 布 乌 
及 第 三 章 中 的 定理 2.6, 有 

i) 给 定 于 中 时 ,A/ 有 二 3 人 NiCW 4 Cp 十 620)，220 ,其 中 
B= Badils Br ™ Ba SnDn Tl, 

ii 给 定 A 了 时， 4 一 op 2 A 从 而 给 定 和 
4 jE] 

AN 有 di ~ NV npRD HB nD ADJ) 

jy A ~ WR 1 ,B10 且 与 《AwyA1t》 相 互 独 卫 ， 

由 于 郊 与 4 丰 互 独立 ,从 而 给 定 及 和 Aun 局 


*» J90 4 


WA (EO 一 La ~ N, CV rp, 
{1 十 Nn! A YE,.,Y 


下 
AAA (元 四 一 一 Li 元 ( N ( / 座 和 : 5 ) 
C1 oF nx AAs "Ana Anao) 


于 是 按 第 三 章 第 三 节 Hotelling 的 至 统计 是 的 定义 ， 给 定 交 人 
和 坟 后 ， (一 7 一 1 (一 1) 正 是 自由 度 为 和 于 一 7 一 1 
一 了 十 1 一 + 一 了 的 统计 量 ， 由 第 三 章 定理 3.1 


站 一 卢 Ti 二 全 一 
s+ (HO—rO—1) 了 


£1 — 1) 


nf nH AATRYY A RY 一 AnAntR) 
5 1 十 nF ATR 


~ Fls,n — Pp,0) 
其 中 非 中 心 参 数 


日 一 3 
1 士 nA 


在 原 仍 设 Hi: 一 0 为 走时 ,给 定 二 0 和 4 后 ， 上述 的 下 分 布 
就 成 为 中 心 的 , 遇 


三 二 人 (一 中 ~ Ressn — p) (3.15) 


关于 检验 假设 (3.10) 也 可 得 到 类 似 绪 果 , 于 是 有 如 下 定理 。 
定理 32 设 xi -zw 是 取 自 正 态 总 体 Ne 3) 容量 为 

# 的 祥 本 (5 > 0 且 未 知 ，z > 让 令 下 一 《有 ) 其 中 以 让 

r+ 维 ，j 册 是 :一 了 一 7" 维 对 于 检验 假设 


Hop = 0, Hi = 0 W300 
其 极 大 似 然 条 件 检 验 的 拒绝 域 杜 ( 当 给 定语 和 如 了 时) 


EE 1) > Fs 2) (3.16) 


其 中 4 为 (3.13) 式 所 未 ,5 为 退 普 水 平 ， 而 相应 于 检验 假设 (3.10) 
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询 概 大 人 忆 然 条 件 检 难 的 拒绝 感 是 ( 妆 给 定 吉 2 和 1 时》; 
2 1 Fs Op) (3.17) 


其 中 


各 1 十 戎 (二 -一 区 一 县 
1+ n(x 一 PY A pi 》 


C3.18) 


T? 四 欣 [二 oY 本 一 pn) 
TT: 一 扫 人 让 恒 3 _ P| 


则 
一 1 一 了。 一 了 
i! 《 一 1 二 了 
当 拒 绝 了 H， 后 可 以 写 出 wm: 的 1 一 “置信 区 域 是 
荐 [元 (3 一 A 一 Hi 一 天 A 
X [无 (3 一 < 光 2 一 [uD ne 有 
1 十 nm -一 FT A -一 pi) 


{3.19) 


迁 二 Paslssn — Pp) (3.20) 


x 

例 3.2 任 症 选择 10 个 学 生 , 对 他 们 两 次 考试 成 绩 进 行 分 析 ， 
其 四 一 次 事先 未 经 过 竺 所 苦 斌 直接 进行 【 记 为 由， 另 一 次 事先 经 
过 模 掀 沙 试 再 进行 《 记 为 1 狐 据 见 表 3.1。 和 着 讲 通 过 仓 们 的 成 绩 
了 解 错 专 考试 是 否 有 一 定 的 效果 。 注 意 到 模 报 址 答 闻 效果 还 与 学 
生 的 基础 有 关 , 因 此 修 定 已 知 所 有 学 生 的 平时 成 绩 是 590 分。 对 于 
此 辣 题 可 作 如 下 的 检 洽 假设 : 

Hp 50, pa— 50, Hisp = 50, po Se 50 
绎 计算 求 得 样本 均值 向量 、 协 放 差 阵 及 相关 给 降 为 
» 192° 


过 8.41 10 个 学 生 两 次 考试 成 绩 


x 


52.3， {250 159Y t 0.83 
和 
Eo 59.5; “159 1487 0.83 1 


由 一 08.83 知 二 次 考试 成 绩 相 关 程度 较 高 ,这 是 符合 实际 的 ， 
Ti nl2 — pSiN(FY 一 gp) 


= 10 (52.3— 503 ， 二 


+ 
Ti nCE— pOYS -AR — pa) 14.1 


二 一 


(52.3 一 50) = 0.21 


(xn 1)+ 7T: 9.21 


HES X11 12.06 
加 


查 焉 表 得 F,ws(1,8) 一 5.32, 因 然 12.06>5.32, 所 以 拒绝 总, 即 和 楼 
执 考 试 有 一 定 效 果 。 注 部 刘 
2250 1431 A A 
人 一 人 aa 1332) (Cy pa 
还 可 由 (3.20) 得 到 pg; 的 0.95 坑 信 区 问 为 
52.80 < pp S63.48, 
《外 3》 两 个 总 体 的 均值 向 量 的 子 向 量 想 等 的 检 恰 
设 Ki Xs 是 正 态 总 体 NE, 3) 的 容量 为 了 的 样本 ， 
了 5 是 正 态 总 体 NeCy, EY) 的 容量 为 型: 的 样本 ， 其 中 0 
日 未 知 , 两 样本 间 相 互 独 襟 ,对 jv 及 王 作 妇 下 的 划分 
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1 Eu SE 
si 小 站 人 1) > 小 
其 中 Pi 2 分 别 起 Fy 的? 维 子 向 量 ，pz 和 二 和 耸 别 是 它们 的 


PP 一 + 一 ! 维 子 庶 量 ，2;; 也 有 相应 的 解 黎 。 我 们 要 检验 的 假设 
是 


‘HpR= pp, Hp 二 Wp (3.21) 
检验 (3.21) 的 思想 方法 与 (三 ) 完 全 一 - 样 ， 读 省 可 自行 推导 ， 在 这 
里 我 们 直接 给 出 其 检验 统计 量 : 
[1 十 一 -人 — FY A EF — 5)] 
nn 十 
| 一 _ (3.22Y 


Ll 士 Rif 《起 5 PLY ACR 9)] 
天 L 各 


和 一 SE (R$)Y5 (sO— 2) 


Le 
Ti 2 (RD 一 FY SIED 一 FD) 
#1 十 - 和 
出 
TT! 
一 1 一 3.23 
让 ‘ ) 
其 中 
于 < Er Ry Sy 4 4 
所 一 { ) 了 一 人 一 人 ") A=( ") 
\ 二 人 部 3 Sa A A 
而 
外 A 
8 十 旨 一 了 
在 如 为 真 时 ,给 定 fo 及 4 的 条 件 下 有 
| QA—1)~ Fmtn—?— 1) C3.24) 


利用 (C3.24) 就 可 以 对 (3.21) 进 行 条 件 检 验 ， 
例 3.3 在 两 周 的 时 间 中 ， 把 16 条 和 鱼 分 成 二 组 分 别 用 通常 标 
» I94* | 


准 饲 料 和 改进 睛 的 乌 料 咀 养 .观察 基体 长 的 于 长 ,数据 列 于 表 3.2， 
由 于 最 初 鱼 是 随机 选取 分 组 ， 故 可 认为 这 两 组 鱼 初始 时 平均 长 度 
是 相同 的 ， 我 们 希望 了 解 改 进 后 的 饲料 是 否 有 显著 成 效 。 即 我 们 
要 检验 假设 
- M2 by 
Ha: ps vti 12305 Hi:p ™ 1 ()z( ) 


| 


表 3.2 两 组 鱼 呐 不 同 饲 料 的 体 长 增长 数据 
鱼 编 号 | 1 2 3 4 5 在 7 总 体 疙 值 


起 始 长 度 | 12.3 | 12.1 | 12.8 | 12,0112.1 | tit8|12.7 pe 


经 计算 得 到 


元 一 【12.288 ,2.425。2.663 了 了 
= C12.113,2.425, 2.8507 
OA14 O128 0.140 
= |0.128 0.146 0.161 
1 \o140 0.4161 0.186 
琵 例 中 下 十 而 一 2 一 8 一 3 一 1 一 3 一 1 一 2， 再 计算 
2 一 22.155,2 一 1.22， 代 人 (3.24) 得 


Lae] 


一 1)- > ,1.373 = 8.238 
s 


但 王 过 得 Fo.st2,12) 一 3.89。 显然 8.238 之 3. 了 39, 从 而 拒绝 Ho;, 风 
改进 饲料 对 鱼 体 的 增长 有 显著 成 效 . 


* 9 


*§ 8.4 总 体 均 值 的 大 样本 推断 


前 面 所 讲 的 总 体 均值 向 量 的 检验 ， 都 是 在 总 体 为 正 态 总 体 的 
前 题 下 进行 的 。 如 何 对 非 正 态 总 体 的 均值 向 址 作出 推断 呢 ? 与 一 
元 统计 相 羡 人 已， 我 们 要 利用 第 四 意 中 所 介绍 的 多 泡 中 心 极限 定 捍 
和 和 大 数 定律 来 解决 。 在 本 节 中 我 们 及 介绍 单 总 体 情 况 以 及 实际 生 
产 中 经 常 遇 到 的 多 项 分 布 总 体 的 参数 推 叫 。 

《一 ) 单 总 体 均值 向 量 的 大 样本 检验 

设 ,Xs 为 来 自 岁 值 向 量 为 上 #, 协 方差 矩阵 为 3(2 之 
8, 未 知 ) 的 总 体 的 样本 ,我 们 变 答 验 假设 


五 0 只 一 ps Hp (4.1) 
记 
一 上 了 x, 号 一 -全 一 5 《xi 一 于 并 i 一 元 了 
或 用 的 检验 绕 计 量 为 


R= nom IX AEYA HF pg) 
二 pK SE Oo 

其 结构 与 正 态 总 体 的 情况 一 样 ,但 现在 总 体 为 非 正 态 总 体 ,上述 统 
计 的 精确 分 布 是 无 法 知道 的 ， 根据 第 四 章 $ 4.1 的 讨论 知道 : 只 
杰 ” 亮 分 大 或 者 说 器 一 了 很 大 了 时， 所 旦 一 种 7 区 关 一 就 近 
位 地 服从 Xp) 分 布 。 对 于 显著 水 平 we, 若 蕊 亚 一 FJS (一 
有) 之 六 -otP), 则 拒绝 原 假设 吕 。 这 种 检验 的 显著 水 平 近 剧 开 等 
于 a。 

我 们 把 上 述 检验 与 $ 5.1 中 的 (一 》 相 比 较 可 着 到 两 个 失 验 的 
统计 量 有 相同 结构 , 但 临界 信 不 一 术 ， 一 个 是 癌 .P》 男 一 个 基 


2 一 上 FLp， 4 一。 更 进一步 地 研究 表明 ， 如 果 2( 一 


RS 《无 一 和 与 科 分 布 近 亿 程度 比较 好 时 ,这 两 个 检验 给 出 了 
* 96 。 


本 质 上 注册 的 结果 。 这 是 因为 当 (一 六 较 大 了 时， 22 二 上 ， 
Fi_(psn 一 pp) 与 难 wpP)》 近似 相 等 
当 措 绝 ,时 , pe 的 1 一。 置信 区 域 近似 地 为 
nx pS (FT pp) < MP) (4.2) 
当 4 一 很 大 时 ,对 于 一 切 1x 09 的? 维 实 向 量 ， [ky 的 1 一 
“ 同时 置信 区 间 近 似 地 为 


| 二 W 和 (人 。 /| (4.3) 


特别 取 [i 《0 ,0,1,0, "07, 其 中 第 i 个 分 量 为 1 其 余 为 
0，> 刚 Hirt 一 之 产 的 1 一 < 同时 置信 区 间 过 似 地 为 


GB VEAP ， y 生 ] C4.4) 


其 中 至 为 五 的 第 i 个 分 最 ，5: 为 5 的 (1) 元 素 ， 特 别 取 了 一 
(C00 100 一 1,0,"…*,0) ,其 中 第 i 个 分 量 为 1， 第 用 
个 分 量 为 一 1 一 下 一 2,3， jp 则 对 所 有 的 〔《m 一 ai) 的 
1 一 & 同时 置信 区 间 近 似 地 为 


2 
[Gi #5) + MRCP) | (4.5) 


其 中 六 ,54 为 区 的 第 站 分 量 和 第 记分 最 ,54 为 5 的 Ci, 鞠 ) 元 素 ， 上 
述 绩 论 的 推导 可 做 看 [261， 

《二 ) 甸 项 分 布 总 体 的 参数 推断 

在 实际 问题 中 ,经 常会 遇 到 这 样 一 种 总 体 , 它 的 每 一 个 个 体 要 
委 具 右 某 属性 ,要 人 和 不 有 具有 该 属性 ， 例 如 所 生产 的 产品 中 ,每 一 个 . 
产品 不 是 次 品 使 是 正品 。 这 种 总 体 由 两 个 不 相 阅 前 类 组 成 ， 个体 
天 是 一 个 服从 两 点 分 看 的 随机 变 其 : 
{ 1 具有 其 属性 

0 不 具 某 属性 

设 缚 为 具有 某 属 性 的 个 体 在 总 体 中 所 占 的 比例 ， 显 然 , X; 的 概率 
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区 一 


分 布 为 
下 pil pi" x0 或 1 
我 们 感 兴 趣 的 是 对 参数 2 的 推 昕 ， 这 在 一 元 统计 中 已 有 详尽 的 讨 
论 。 
如 果 总 体 中 的 个 体 分 为 严 十 1 个 不 相同 的 类 ， 且 个 体 属 于 第 
丰 个 类 (一 1 # 十 1) 所 占 的 比例 为 pisk 一 1 2 


二 十 上 ， 且 psi 一 1 一 全) Pi。 念 来 自 第 大 类 的 个 人 笨 对 应 一 个 
《mm 十 1) ~ ] 向 量 : 【000 1 0 0 了 ， 其 中 1 出 现在 第 不 


个 分 量 的 位 置 上 。 众 所 周知 出 这 种 个 体 组 成 的 总 体 其 概率 分 布 为 
机 十 1 项 分 布 (多 项 分 布 ), 写 成 向 晤 就 具有 如 下 结构 形式 ; 


类 别 | 1 2 2 m+ 
0 0 
1 0 : 0 
0 0 0 
观测 : 
向 量 上 0 0 0 : 
: 0 站 
0 0 : 
0 0 1 
概率 | 名 PP pm pol— D2) 


k=1 
C4.67 
设 xi、 xs 汶 来 自由 坎 十 1 个 不 同类 组 成 的 总 体 的 样 
本 。 涯 x 来 自 第 名 类 , 则 xi 所 对 应 的 向 量 的 第 下 个 分 量 x 一 
1, 其 余 分 量 于 一 0 GA 而 ;来自 第 类 的 概率 为 站, 所 以 
有 Prtxii 一 1) 一 pi: 于 是 pi EX) = pryTis — varCeis) 
Pil 一 所 )，。 因 为 当 了 所 大于 x 与 zi 不 能 同时 为 1， 所 以 避 的 
第 太 个 分 量 xri 与 第 1 个 分 量 zj; 的 协 方差 为 
GH COvEKA di) = ~ Pip 


从 而 xi 的 方差 协 方差 阵 为 
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1 一 下 一 
Zr COR I mt m+) 其 中 FR 人 户 2% nh 所 
本 


按照 结 宰 C4.6), 样 本 Xt 一 1 .2 ， " 的 谷 本 均值 向 量 为 


C4.7) 


B—x— Dx (pbs bon) (4.8) 


2 i 当 %i 属 杆 第 类 
i 二 二 之 Xi Ti {, 否则 


Pr 表示 了 样本 中 肘 于 第 不 业 的 个 体 所 占 的 比例 ， 显 然 育 


p— ECxX) em Cps pis Pati) 1 COVYCTE,) ™ 二 


其 由 为 (4.7) 所 示 。 由 第 四 章 的 多 芜 中 心 极 限定 理 知 道 V = ， 
(一 于 ) 一 V #(B 一 P) 的 极限 分 布 为 NatC0,3), 即 当 较 
大 时 

V (一 pp) 近 似 服 从 Nt,C0,》 (4.9) 
如 果 Tk FR 分 别 用 尝 们 的 估计 i ™ Pkt 一 pis Sai — pp; 
(As 让 米 代 替 。(4.9) 式 仍 近 位 成 立 。 即 W 4B 一 中 近似 服从 
Neari〔K0, 羡 ), 其 中 2 的 元 素 为 Gu 和 ji6;。 注 音 到 ZZ 和 过 的 秩 都 是 
m-。 它们 的 逆 短 阵 不 存在 ， 但 我 们 仍然 可 以 近似 构造 所 有 线性 组 
合 Lp 的 工 一 “ 问 时 帝 信 区 间 ( 参 看 [26]): 


rps /二 /2 C4.10) 


其 中 所 为 《4.8) 所 示 ， 根 据 实 际 问 是 的 避 吕 可 选取 不 同 的 1{， 龙 
应 用 中 ， 充 分 太 的 # 可 理解 为 # 满 是 si 产 20, 不 一 1，2,….， 
mm 二 1, 

例 4-1 为 了 研究 洗衣 机 在 黄 地 区 的 销售 情况 ,对 4,8、C 三 
个 主要 上 家 的 产 遇 在 该 地 区 的 销售 比例 进行 调查， 每 个 被 调查 者 
回答 下 述 问题 ; 你 购买 的 寿 农 机 起 对. 石和 中 的 最 一 家 ? 或 者 是 
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其 它 厂 家 。 设 4,8、C 三 个 厂家 的 销售 比例 为 ,名 , 如 , 币 其 它 广 


家 的 销售 比例 为 一 1 一 这) Ph 有 答复 的 户 数 为 530 户 ， 调 
查 的 数据 列 在 表 41 中 。 
琢 4.1 洗衣 机 销售 情况 调查 数据 


厂 法 | 4 8 C 蔷 它 
购买 卢 数 187 215 8 | 0 
-| . ; 
总 体 比 们 pL P+ 一 1 一 pr 
风 l 
样本 比例 


电表 中 样本 比例 brs A 1,2,3,4, 计 算得 
0.2244 —0.1326 —0.0544 一 0.0374 
一 0.1326 0.2379 一 0.0624 —0.0429 


下 一 
一 0.0544 —0.0€24 0.1344 一 0.0176 


-一 0374 —0.0429 —0.0176 0.0979 

选取 [一 (C1,0,0,0) ,1t = CD100Y, ff— 00,1.0) 及 =- 
00,0,0,17 ,对 一 005 查 她 表 得 总 w(3) 一 7.815。 根 据 (4.10) 
计算 得 户 , 包 ,如 ,名 的 0.95 同时 置信 区 癌 为 

0.28 < 六 妆 0.40， 0.33 之 身 拓 0.45， 

0.11 志和 0.21， 0.07 安 揣 <015。 
着 选取 一 0; 一 1,0,0》， 则 Lp 一 户 一 吉 ， 此 时 是 把 4 有 两 
厂 进行 比较 ,经 计算 得 pp 一 所 的 0.95 团 信 区 间 为 一 046 委 包 一 
各 所 0.05, 这 个 区 加 包含 了 0, 可 以 认为 4、B 两 厂 在 该 地 区 的 销售 
比例 无 显著 差异 。 


$5.5 协 方差 阵 的 检验 
本 节 是 讨论 对 多 元 正 态 总 体 的 协 方差 阵 的 检验 。 检 壁 的 绕 计 
和 200 和 


其 玫 是 利用 似 然 比方 法 孚 出 的 。 其 分 布 绝 大 部 分 元 是 采用 近 侯 分 
布 。 
《一 ) 协 方 羔 阵 等 于 已 知 矩 阵 的 检验 


设 xz …-，xX。， 尼 笠 门 正 态 总 体 Non,3XZE > 0,n 之 pp) 的 
冬 本 ，y 和 卫 都 旦 未 知 ,我 们 楼 检验 的 很 设 是 
HF Hs C5.1) 


其 中卫, 沪 始 定 的 正定 短 阵 . 

因为 3, 正定 , 仓 在 韭 坷 磺 扎 耻 分 得 DED 一 1. 令 六 一 
Dais 7 112,..** ,rn, Ul 

y; ~ NDE,DSED) = Na", 3*). 
这 时 相应 于 (5. 了 1) 的 假设 等 丛 干 
Hi:3* = 1 H:3* el 《5.27 

定理 54 设 嫩江 一 127 为 来 自 总 体 CR ED) 的 样 

本 ,检验 假设 (5.1) 的 似 然 比 统计 最 为 


pp 


1 一 (二 ) Izodalierp {— 二 2 《5.3) 
其 中 
二 一 SY x, — Rx — £Y, 研一 工 Dx 


ni 


=1 


证 明 ”当前 坊 述 , 令 y; 一 Dx:，D 为 非 奇 异 阵 ， 栓 验 (5.1) 等 
价 于 检验 (5.2》)。 此 时 概 然 函数 为 


_ 上 二 ， 
ECpe ,3*) (24) 7 |2*| 全 axp {t+ 2 


* (> (yi 一 Hy; 一 ay 让 


参数 空间 晤 一 {Cpg*7，2*);p* 为 任 沉 ? 维 实 向 量 ，2* > 9， 在 
呈 。 之 下 , 子 集 昌 开 {C2*);pY* 为 任意 了 维 实 向 全 ,2” 一 中 、 
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一 
pa Lp. 5*) ~ (EF) | 18| iexp1 一 上 ap} 


"生理 .证实 当 
其 中 
B= Dy — pMKy— 3), 3— + Py, 
fal ft 
机 
max LL(lp*, 2F*)— G27) exp({— ls} 
1 Fr， 2 
于 是 似 然 比 统 计量 
np 
i (<) IB! iexp{— 1 urB} 5,4} 
4 : 2 


由 于 DE,D’ 二 了 ,3 DD= 37 又 yy 一 Dxi, 所 以 


B= Sy — Py ~ FY 


— DI 5 x, — a — zy|p’ ~ DAD 


IBI ~ IDAD'| = 1 E541 
tirB we tr(DAD'Y = tr( S71iAY) 
将 它们 代入 C5.4) 便 得 到 (5.3)。 时 
由 于 以 4 为 基础 的 似 然 比 检 验 不 足球 人 般 的 ， 将 4 中 的 #* 攀 成 
旬 一 ] 后 得 到 的 局 然 比 检 哈 可 证 明 它 是 无 候 徇 。% 统 计量 等 价 于 
绕 评 量 一 21n1, 
定理 .2 在 用 为 真 时 ， 一 ?ni 的 极限 分 布 是 自由 度 为 
六 PLP 十 1 的 类 分 布 


该 定理 的 证 最 见 [7。 

检验 的 具体 步 爱 如 下 : 

i 极 汤 样本 秆 x;，i7 一 1,2,'…*,#。， 由 (5.3) 计 算出 4 值 ( 注 
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意 1 中 的 二 要 用 一 工 代替 ); 

ii) 由 维 定 的 显著 水 平 c, 查 
分 布 表 得 临界 值 准 _ 让 j 

iii》 著 一 2m1 因 关门 或 12 世 oe 站 iW ， 则 拒绝 原 候 设 
是 :五 一 2,, 

例 5.1 在 服装 未 准 制定 中 , 协 方差 矩阵 是 重要 的 参数 ， 从 长 
期 的 调查 中 已 知 北京 市 成 年 女子 身高 如, 欧 围 x 和 腰围 mx 的 包 方 


差 阵 为 
29.57 
-| 3.92 39.05 } 
1.76 39.19 63.07 
为 了 验证 .近期 抽取 100 位 成 年 女子 ,经 剂量 并 计算 得 这 三 个 变量 
的 样本 协 方 垂 乱 阵 为 


22.12 
:| 2.98 32.72 
0.46 30.39 50.98 
我 们 希望 知道 近期 的 成 年 女子 的 身高 、 胸 围 和 腰围 的 协 方 莱 阵 是 
否 与 原来 的 3, 一至， 通过 计算 有 
:0.03450 
Er 一 -000s 0.0602 
0.00316 一 0.0429 0.0424 
tr ET .5474 
[5,| =— 26862.84, ln|5,| 一 10.198 
13| 一 16092.31 in139| = 9.686 
将 它们 代 进 一 2ln% 得 
一 2jn2& 一 (1 一 1)[in13| 一 9 一 户 十 让 2197?] 
eo 99 4 [10.198 一 9.686 一 3 十 2.5474] 一 5.88 
对 于 一 005， 林 邓 洪 得 发 s06) 一 12.59， 显 然 ， 一 zjnz 二 
训 ,mb62， 从 而 不 能 拒绝 寺 ，,， 


四 度 为 1 一 上 PLP 十 1) 的 x 
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(二 ) 球 性 检验 
设 Xi 一 1 2 站， 汶 总 体 NHR 2) 的 样本 {n> 各) 
其 中 上 和 2 六 0) 都 未知, 要 检 恰 沪 设 
HT = os,, Hg ¥ 0, (5.5) 
其 中 互 为 给 定 的 计 世 上阵 ， 呈 是 一 个 未 指 完 的 正常 数 。 琵 假设 
节 含 义 为 总 体 协 方 益 与 给 定 的 正定 知 阵 也 是 其 成 比例 ， 
类 但 于 (一 ) 的 讨论 , 令 3 一 Dxj,， 一 1:2 2 其 中 DD 
为 泪 足 DED 党 工 的 非 厅 异 阵 , 则 一 1,2, 02。 为 来 自 
NiCDP,DED' ~ No(p*，,3*) 的 样本 ,C5.5) 的 假设 化 为 
月 :34 gall, HS* 0 {5.6) 


(5.6) 的 采 , 为 真 和 寺 ， 说明 随 视 向 量 的 各 个 分 量 之 闻 相 豆 独 立 且 有 
祖 同 的 未 知 方差 。 这 相当 于 正 态 密 麻 的 等 值 商 丰 一 般 的 辆 球面 
一 一 为 常数 ) 转化 为 一 个 球面 《? 一 
yy) 一 0 这 称 为 球 性 检验 。 扣 果 让 已 知 且 等 于 1, 贡 
就 是 ( 一) 所 讨 沦 的 问题 ， 

利用 似 然 比方 蒜 及 (一 ) 中 所 用 的 记号 ,我 们 有 以 下 定理 ， 

定理 5.3 设 Xf 一 1，2， 一 fr 为 总 体 Nip 2》 的 样 
本 ，( 之 P), 其 中 和 2C3 > 0) 部 炒 知 ,检验 假设 (5.3) 的 似 然 
比 锅 计 上 为 


at -A (5.7) 


证 明 留 给 读者 完成 ， 
在 实用 中 ,我 们 取 汶 价 统 计量 


x, Prl2a'Ad| 
1 OO TF C5) 


Mauchiy 在 1940 年 导出 了 1 的 各 阶 矩 ，Davis 在 1971 年 敬 冬 了 
壬 改 了 的 1 在 中 的 地 全 以 于 一 1 的 近似 分 布 并 证 明了 着 下 结 
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论 f 见 [7 全 。 
定理 5.4 在 5. 中 的 日 ,为 走时 . 当 # 一 90 时 一 C(x 一 1)* 
Pln4 渐 近 于 自由 度 为 二 PCP 十 1) 一 1 的 好 分 布 ,其 中 P 一 1 一 
2 六 十 所 十 2 
p(n— 1) 
(三 》 均值 向 县 和 协 方差 矩阵 等 于 给 定向 墨 和 和 托 阵 的 检验 
设 站 一 12 ya 是 从 生态 总 人 fa) 中 抽取 的 样 
本 (5 之 p)， 其 中 严 及 23 > 0) 都 是 示 知 的 , 变 检 验 的 假设 是 
H,:p — po SC 2,, 
月 :下 一 Ra 一 了 至 少 有 一 个 等 式 不 成 立 {5.9) 
其 中 jp, 是 给 定 的 向 量 ， 了 3 是 给 定 的 臣 定 和 矩阵。 由 于 53, 正定, 在 
在 非 青 异 振 阵 万 清 足 DDE,D 一 上 ， 作 要 换 六 一 DKzi 一 pr)， 则 
NORY 其 币 pT = Dp ,3* ee DED . 此 时 
(5.9) 转化 为 
Hp*— 0, 3 呈 了 了 
Hp* 一 人 3 二 至 少 有 一 个 等 式 不 成 立 《5.10) 
类 似 于 (一 ), 和 和 用 羽 然 比方 法 恒 可 证 明 如 下 结 
定理 55 设 zi 1,2, 2。 是 取 自 总 休 N,Cp,3) 的 样 
本 (ma> 门 , 其 中 中 和 503 > 0) 都 未 知 ,检验 假设 C5.9) 的 似 然 
比 终 计量 是 


凡 虹 


414= (<) IEiiAlTexp 全 工 tr 亚丁 1 
:上 2 


{4+ pF p71 (5.11) 


从 上 面 定 看 可 发 现 ,统计 量 (5.11) 正 是 检验 假设 HH,:3 一 2,， 
五 :也 过 了 的 位 然 比 统计 量 


2 一 (二 ) 24 二 二 2 
振 可 


。 205F 。 


与 在 三 一 3 已 知 时 检验 假设 及 :一 二 :天 的 检验 山 
计量 
li 一 exp {— > (于 一 本》20K 天 一 po)} 


的 乘积 , 即 4% 一 4， 2。 注意 到 4 与 是 相 五 独立 ， 而 和 仅 是 和 的 
冰 数 ，7, 区 是 喜 的 殖 数 ， 所 以 殉 与 妈 是 相互 独立 的 。 还 可 以 下 
明 以 (5.11) 为 基 亚 的 检验 是 无 伍 的 。 
由 于 4 一 4 404 和 且 1 与 4 独立 ; 太 而 

一 2in4 一 一 2In4, 十 ME 一 上 ST 一 i.) 
在 再 , 汐 真 时 , 工 式 右 端 第 二 项 服从 到 的 分 在， 第 一 项 外 定理 5.2 


知 渐 近 服从 x*( 代 2 二 内) 分 布 .从 而 有 


定理 5.6 在 (5.9) 中 原 假 设 晶 p 一 J ， 了 一 了 为 直 时 , 绕 


计量 一 2In4 浙 近 眼 从 自由 度 为 了 PP 二 1) 十 p 一 了 PP 二 3) 
的 好 分 布 
(四 ) 多 个 协 方差 矩阵 相等 的 检验 
设 x 一 1,2,- ,2 是 从 第 个 独立 正 杰 总 体 六 Pt 
351) 地 取 的 容量 为 mn > 如 的 样本 ， 其 中 he 和 3 > 0) 
~ 1,2,… -9 都 是 未 知 的 ， 我 们 要 检验 的 假设 是 
有 3, 一 3 一 ,一 了 (一 3)， 


NP 一 1, 2， 不 全 相等 {5.12) 
其 中 于 是 某 一 个 未 知 的 正定 失踪. 
记 
El bp x A 5 CX 一 OCXR 一 KRY 
i fel 1= 
二 pa 4 入- Y， ME 
| 点 三 


定理 5.7 设 x 负 小 一 12 为 来 自 总 休 NC 
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的 容量 为 mta > p) 的 样本 , 不 一 1,3, ,县 这 人 个 样本 择 
喜 独 立 , 则 检验 假设 (5.12) 的 羽 然 比 绕 计 慑 为 


(C5.13) 


证 明 ”此 时 参数 空间 
8 一 {Cp 为 酝 意 ?维和 语 量 ， 
21 > 0 一 1,26.°,9) 
相应 于 态 , 的 参数 子 空 间 
加 ,一 TD- -033 3 为 任 普 哺 维 实 铭 量 ， 
3 一 及 人 0 一 1 29 


似 然 函数 是 
村 
EC se HOD, Ea CR) 
Pe 
-人 -2 1 
™ (2x) UL | 了 | 7 erp [十 


| .SCxb 一 Pb (xf 一 sy | 
因为 每 个 因子 L(g,30) 只 与 Rb 和 Zi 有 美 , 故 楼 使 LCs， 
0; 加 ,人 4) 极 大 化 ， 只 须 对 各 个 因子 Lig,Z4) 报 大 化 ， 
即 有 


” 4 
= + 
max Lp yes HE Te) CO [I Lee， 全 ) 
8 二 下 
9 本 一 上 | 
一 下 (zz * 全 | ”exn 《一 2 
| 于 l 2 
Pp ? 1 1- 旦 
一 《2x) 7 1 exp 仁 叶 ， [全 
2 
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4 ， 
hax LR ,GO [FT L (ze ， 4) 
0 


ta1 |/ 


十 是 


max Lp ,+ ;DY | 


各 Do 


max 三 (po “ 1 


ce 上 二 了 四 Wj 
于 3 .24 
ME 帮 讲 

=1 


以 4 为 基础 的 似 然 比 检验 不 是 无 偏 的 ,但 如 果 将 1 中 的 4 修 
改 为 中 一 1, 从 而 # 变 成 一 9 经 过 修改 后 的 4 记 为 47, 即 


四 一 1 


- 4 2 ik 
2 一 - ”3 全 2 < 《5.147 
1 i II (人 一 1 7 


以 ?* 为 基础 的 检验 是 无 偏 的 。 下 面 是 Box 给 出 4* 的 有 关 渐 近 分 
布 。 

定理 5.8 在 (5.12) 中 原 假设 以, 为 俱 时 ， 一 28ln 4* 当 n -woo 
以 及 Hm 元 > 9 时 渐 近 地 服 从 自由 度 为 上 一 宁 Pz 十 1)(g 一 
1 的 妇 分 布 ,其 中 


?28 十 3 一 1 2 1 1 
6 十 1X9 一 卫 [2 gl 
《一 不 全 帮 等 
1 一 二 3 二 1g 二 当 坟 下 机 二 


dtp + 12 一人) 
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二 和 用 7T? 统计 区 检验 两 个 正 态 
上 ， 必须 完 矿 定 这 苦 个 总 体 是 次 有 宰 辣 的 协 方差 阵 ， 这 时 就 轨 利 有 


工 述 的 检验 ， 
例 5.2 


总 体 是 否 有 相同 的 均值 向 符 


二 


三 种 不 同 的 蔓 尾 花 的 两 个 描 标 : 花瓣 宽 , 花 坦 宽 分 别 


服从 二 元 正 态 分 布 Na GE 1,2,3)， 现 分 别 抽取 了 容量 
为 一 一 一 50 的 样本 ,并 计算 得 样本 协 方差 矩阵 分 别 为 


4 


£4-( 


-( .0588 
“0.0323 


0.0661 
0.0298 
“0.0711 
0.0333 


0.0298 
oo6o1) 
0.0333 
0.0400) 
0.0323 
0 0810) 


为 了 建立 Bayes 判别 函数 (参见 第 七 章 例 2.2), 首 先 必须 检验 
M,; 2 = 22 是 否 成 立 。 为 此 计算 


0.0661 0.0298 
A,| 一 49 一 7.4061 
0.0298 0.0601 
0.0711 0.0333 
4] 一 49 一 4.1660 
|0.0333 0.0400 . 
0.0588 0.0323| 
A,| 一 4 多 一 8.9931 
0.0323 0.0810 
0.1960 0.0954 
4 一 | 如 十 4 十 4 = 49? 一 63.3731 
0.0954 0.1811 
薄 例 中 天 一 有 十 1 十 2 一 150， PP 一 2 43, 并 将 它们 代入 


(5.14) 成 计算 每 


而 
有 一 1 


FF oo 3,02856 xX 10™ 


_ (2p’ + 3p. 本 (Cg- 十 1) =—= DO.9804 
6Cp+ D(a— g) 
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所 以 
—28in A* 一 11.3673 


查 自由 度 f 一 广 PCP 十 1X9 一 1) 一 6。 显著 水 平 < 一 0.05 的 冯 


分 布 表 得 临界 亿 7) 一 12.59, 民 的 J 

28ln4* < 难 央 的 
于 是 不 能 拒绝 凡 ， 即 三 个 二 维 正 态 总 体 的 协 方差 抱 陈 没有 显著 差 
异 。 


(五 ) 多 个 正 坊 总 体 分 布 相同 的 检验 
设 xp ,一 12， Ai; 为 来 自 第 克 个 总 体 NCp 避 ,320 的 
冬 本 外 一 1,2,… ,4 ,要 检验 的 假设 是 
Hip Dep pp), 
El PF (=) 
1 
至 少 有 一 个 不 全 相等 (5.15) 


记 I 


好 是 
ES xh x "a 


tH. Exl 1 Earl 


= 
— BCE 4 DIA 


[| 二 二 全 


可 nk 
及 一 全 六 (xz 一天) 人 一 部 了 


一 有 十 > nC — (Xt XY 
定理 5.9 检 蛤 候 设 (5.15) 的 似 然 比 统计 量 为 
Tl al a 
4 2 - {5.16) 


wi a 


t= 
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证 骨 类 似 守 定理 5.7， 污 者 可 自己 完成 ， 
与 ( 宇 ) 的 情况 相 类 似 , 阁 记 检验 假设 (5.12) 的 亿 然 比 绕 计 鼻 
《5.13) 为 4, 记 当 台 相 同时 检验 多 个 总 体 的 均值 是 否 相 等 ( 坊 第 六 


意 第 3 节 多 元 方差 分 析 ) 的 检验 统计 屡 为 为 一 141 7 六 司 ,由 时 
可 以 发 现 4 一 和.， 为 ， 在 实际 应 用 时 ,我 们 是 采用 (5.16) 的 修改 形 
式 , 即 在 (5.16) 式 中 用 #4 一 1 代替 4, 4+ 一 4 代替 a， 修改 后 的 统 
计量 记 为 


a 2 Tap 
[I [A 7 Cn gg) i. 
和 《5.173 


iDp 


I “I Cm 1) 
定理 区 10 在 (5.15》 中 8H, 为 走时 ， 一 2Fln A4* 当 上 一 00 及 
fm 于 > 0 时 渐 近 地 服 从 自 由 度 j 一 十 (4 一 plp 十 3) 的 办 
分 布 ,其 中 ia 为 (5.17) 所 示 , 而 
p=!1— (P| 


r= Bil 六 一 到 


6 一 1 包产 十 3 《一 了 六 让 十 3) 
束 5.1 甲 , 乙 两 地 段 样 地 的 三 个 树种 的 茧 积 量 数 提 


‘(2 2 不 十 3 一 1 )+ 一 和 十 2 


梓 地 号 1 2 和 16151819 

地 针 了 时 开本 x |3.6|1.7|2.110.511.3| 9 [soli.sie.4la. io 

恨 | 赔 叶 乔 林 |8.914.7153.0 53.419.017.4|6.8l10.1| 6.6|6.514.7|5.7 

下 乔木 四 0.7 (10l2.0|2.0|1.0 [4.3lo.2 11 lo.3lo.s ls.4|0.7 

~ 样 地 号 ]113 | | 12 

针 旺 齐 相 zs， [2.1i1.4 1 .3 

段 | 闭 时 乔木 zs。 |8.5 5. 
亚 乔 本 #， 


例 5.3 为 了 鉴别 请 地 段 上 袜 分 结构 是 否 让 阅 , 在 每 个 地 眉 设 
置 了 12 个 样 地 ( 即 每 个 地 眉 抽 取 了 容量 为 12 的 样本 ) 分 别 对 针 叶 
乔木 阔 叶 乔木 及 亚 错 木 测 定 了 样 地 内 的 获 积 最, 数据 别 于 表 5.1。 
所 谓 困 分 结构 是 否 胡 局 就 是 要 比较 树 冲 组 的 组 成 是 否 相同 ， 即 要 
检验 二 地 候 树 钟 瘟 积 量 的 平均 是 否 相 同 ; 馈 时 还 变 比 较 树 种 的 相 
关系 是 冤 相 同 , 即 要 检验 二 地 段 树种 蔡 积 量 的 协 方 差 阵 是 否 想 问 . 
于 是 我 们 的 原 假设 为 Hui:p 人 一 p22 

由 表 5.1 的 数据 可 计算 出 


1 
A Dx — Rx — RY 
f=1 


39.44 0.73 一 18.19 1 
一 | 0.73 35.81 一 5.55 | 
一 18.19 —5.55 18.38 


了 2 
人 一 >) 《和 局 一 元 全 ROY 
iml 


"341.31 18.35 一 19.29 
-| 18.35 36.04 一 17-32 
一 19.39 一 17.32 25.39 


机 一 六 (xi 一 二 (xp 一品 


nt 一 1 
7 70.70 1913 一 37.45 
-| 19.13 ?2.07 一 22.53 

一 33.45 一 22.53 43.90 ) 
再 计算 它们 对 应 行列 式 的 值 : 14 一 13033.00,| 4 一 9633.57， 
IW| 一 102970.42。 8~= 1 0.00205 一 0.99795, 4g 2 一 
zz ie 12。 代 入 统计 量 一 26In4* 得 

—28ln4* =— 3.04 


对 于 a 一 0.05， 得 自 由 度 f 一 地 (2 一 上 "3"G3 十 一 6 的 
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分 布吉 得 Mb) 一 12.592 ,显然 一 281p 49 < B60), 所 以 不 能 
拒绝 号 ,, 即 认为 甲乙 两 地 段 杯 分 结构 相同 。 
〈 六 ) 独立 性 检验 
一 个 靖 维 随机 朋 量 虽 分 为 两 个 子 向 量 , 即 x 一 (x xc， 
如 果子 向 量 x 与 < 独立 ， 则 和 企 处 理 多 元 统计 分 析 中 的 许多 问 
会 带 来 极 太 的 方便 。 对 于 正 楚 市 言 ，x 呈 与 x 的 独立 等 价 于 
它们 的 协 方 凑 艳 阵 covtx 人 x) 一 0， 央 此 检验 x 中 与 x 的 独 
立 性 等 价 于 检验 其 协 方 攻 阵 等 于 零 拓 阵 。 下 而 就 克 一 般 的 问题 进 
行 讨 论 ， 
设 底 ~ N(R,2).3 之 0, 将 x 划分 成 8 个 子 向 量 , 其 均值 向 
量 gp 和 协 方 差 阵 了 也 进行 相应 划分 : _ 


辣 pn Eo 
< oo) zi 
x Fh Ee 


ER ?4 


其 中 x 的 维 数 为 和 大 一 1,2,:… ,9; 且 S pi 一 p。 我 们 要 考 


查 子 向 量 xx 之 间 的 相互 独立 性 , 它 等 价 于 检 驻 人 拒 设 
用 :3 一 站 开关 和 用: 5 不 全 为 0 矩阵 ,kK 辕 (5.18) 
设 x 2 为 | 的 容 册 为 n(# 之 Pp》 的 

样本 ，pg 与 了 C3 > 0) 都 未 知 ， 对 于 xi 一 1 2， 2) 样本 询 


值 商 量 关 及 4 一 (xi 一 基 )Cx; 一 对 》 作 相应 划分 : 


i 


x 
| : EE 
六 9)， 
元 人 人 
人 
元 (9 < 


1 了 


利用 多 次 应 用 的 似 然 比方 法 可 证 得 下 述 定 理 。 
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定理 5.11 设 X= 1 ， 2,---， 首 为 正 森 总 体 NC 总 
的 样本 《2a 之 站 ?其 中 只 和 了 > 0) 都 是 未 知 , 检 验 假设 (5.18) 
的 似 然 比 绕 计 量 为 


-A (5.19) 
I 4 
通常 采用 的 是 等 价 统计 量 
1 一 2 一 4 ， (5.20) 
Ta 


4 也 可 以 用 禅 木 和 关系 数 尽 来 表示 ,将 民 也 作 相 应 的 列 分 。 记 e 
和 rj 分 别 为 4 和 及 的 (六 门 元 素 ,容易 看 出 上 一 一 二 一 ,因此 
有 Va "i 


大 
Ial ~ IRI*: TI a [Aul 一 RulTI 你 入 
t=t i én 


其 中 

一 本 志和 十 加 十 十 十 1 十 志和 十 

十 Pi 二 2)5- 一 -志和 十 记 和 十 十 Pi 二 pxr)} 
将 它们 代 人 人 ({5.20) 便 得 到 
1 一 一 下 | 一 (5.21) 
H IRi4| 

在 瑚 ,为 真 时 4 的 分 布 是 什么 ? Anderson 的 书 [7] 指 出 4 的 分 布 
与 一 些 相互 独立 的 8 变量 的 张 积 和 的 分 布 相同 ，Bex 1949 年 证 明了 
下 述 结 论 . 

定理 5.12 在 (5.18) 中 于, 为 真 时 , 一 mln4 当 # 一 00 时 渐 


过 服从 自由 度 为 f= 十 人 产 一 习 组 ) 的 入 分 布 ,其 中 
Ck | 


”了 


P— Spi 
:2 一 宫 ) 

畦 出 是 在 4 一 2, 志 一 1, 思 一 了 一 1 时 ,由 第 二 章 (3.8) 式 知 
道 ,总 体 的 第 一 个 分 涝 % 与 其 余 分 量 (+2,…- ,x,)》 的 复 相关 系数 
为 8 一 32333ufo,， 所 以 独立 性 的 假设 于 :3 一 0 等 价 于 
有 H,:6 一 0。 即 在 此 情况 下 问题 化 为 对 总 体 的 一 个 分 量 与 其 它 分 量 


的 复 相关 系数 等 于 0 的 检验 。 由 第 四 章 定理 2.7 知 ,在 避 , 为 真 时 
有 . 


纲 一 站 一 了 一 


np 
中 一 1 1 一 关 
其 中 六 一 441a dy 一 《aa yi 于 是 ,对 于 显著 水 
平 ;由 上 分 布 表 可 查 每 痢 界 值 Fi.olp 一 1,n 一 P) 根据 
~ pp 1 
he) 
成 立 与 否 来 决定 拒绝 还 是 接受 原 假 设 H,:5 一 0. 
如 果 更 特殊 地 当 4 一 2, 包 一 1, 刀 一 1, 这 时 独立 性 的 检验 正 
是 二 元 正 态 总 估 相 关系 数 p 一 0 的 检验 问题 。 类 似 地 可 利用 第 四 
章 定理 2.4, 当 朋 ,: P 一 0 为 真 时 有 
一 Vz 一 2 ~ Kn 2) 
1l—r* 
其 中 > 一 ca/MW aaaas， 由 冶 定 的 显著 水 平 “ 及 自由 度 a 一 2 查 # 
分 布 表 得 临界 值 s(n 一 2) 根据 1?| 之 6_s (a 一 2) 成 立 与 否 
决定 拒绝 还 是 接受 原 假设 ， 
与 此 类 似 地 也 可 以 对 偏 相关 系数 是 否 为 o 作出 相应 的 恨 设 检 
验 , 此 时 只 须 利用 第 四 章 推论 2.2 作假 设 检验 。 
例 5.4 ”对 河水 进行 了 12 次 测量 ,测量 的 对 象 是 #i: 水 中 氧气 
含量 的 自然 对 数 ，za: 水 流速 度 的 自然 对 数 ，%: 水 深度 的 自然 对 
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~ Fp—1n— pp) 


数 。 由 所 演 数 据 计 算 其 样本 了 方 差 阵 和 相关 系数 阵 分 别 为 : 
7.250 0.507 —3.878 1 4.272 一 0.902 
-| 0.480 一 0.056 j -| 1 ee 
2.550 1 
首先 , 我们 检验 x, 与 * 的 相关 系数 pis 是 否 等 于 0。 计算 
i nn2 ” ruf Vl— 7 
— V10 x 0.272/ v1 一 0.2722 一 0.8938 
对 于 ge 一 0.05 查 自由 度 为 10 的 :分 布 表 得 临界 值 ng 《107 一 
fost10) 一 2.23, 显 然 | 训 一 0.8938 之 2.23, 十 是 pw 一 0 不 绥 拒 
绝 。 


其 次 ， 我 们 检验 在 x, 给 定时 与 x 的 篇 相关 系数 en 是 否 
等 于 0。 先 计算 偏 协 方差 算 阵 
$12 — $1 — SSa $n 


7.25 0.507 -一 3.878 
一 人 507 0， 一 ( 0 056) 
“(C255) Ce—3.878 — 0.056) 
( 7) 
DB.42 .48 
由 此 可 计算 山 祥 本 偏 相 关系 数 rss 一 0.42/V135 X 0.48 一 0.52 
根据 第 四 章 推论 2.2, 知 道 在 ow. 一 0 为 真 时 ， 
= Sr i hs ts 3) 
将 ro 一 0.52 代入 上述 44 统 计量 得 1 一 1.826， 对 于 ww 一 0.05 
m9) 一 2.26, 显 然 ja 之 5ms(), 所 以 不 能 拒绝 pos 一 0.。 
最 后 ,检验 x, 与 《zz》 的 复 相关 系数 一 pa 是 否 等 于 0. 
此 时 可 计算 样本 复 相关 系数 产 一 S34 一 0.864， 并 代 人 统计 


2 
量 一 了 一 上 .全 一 28.6. 对 于 4 一 0.05, 痢 界 慎 为 Fg(2， 


* 了 在。 


“ 半 |NJ 


9) 一 4.26, 万 然 有 > Fisg(2.9) 所 以 5 一 0 的 假设 这 该 拒绝 ， 

上 而 讨论 说 明了 :， 水 速 对 第 气 合 量 没 存 最 蓝 影响 ， 即 使 当 水 
深 维 完 后 也 是 这 样 ， 由 于 5 一 S 十 产 8 风水 速 和 水 深 影 响 了 
握 含 量 的 方差 的 86.4 多 ,而 由 于 呈 一 0.814, 水 深 影 响 了 氢 舍 量 的 
方差 的 81.4 玉 ,由 于 一 0 的 假设 立 拒 绝 ,从 而 锯 气 省 量 与 水 过 、 
水 深 之 间 显 著 存 在 着 线性 统计 关系 . 

在 本 节 给 锯 了 许多 有 关 协 方 莹 本 的 似 然 比 检验 绕 计 量 的 浙 近 
分布 。 读者 可 能 已 注意 到 ， 它 们 都 是 形 如 一 plnX4* ~ CH 的 形 
式 , 这 里 的 p 对 于 太 同 的 似 然 比 统计 量 是 不 同 的 ， 然 而 好 分 布 的 
自由 麻 地 是 有 一 定 规律 的 , 它 等 于 在 日 下 未 知 参数 的 个 数 与 在 @， 
下 未 知 参 数 的 个 数 之 差 。 例 如 在 (一 ) 中 检验 假设 各,;3 一 3.;H,: 


2 马 。 在 日 中 卫 的 未 知 参数 有 MKP + 1)，k 的 未 知 参数 个 
数 为 总 共有 二 &P 十 1) 寸 缚 个 未 知 参数 , 币 在 9, 沾 末 知 参政 
仅 有 的? 个 末 知 参数 。 所 以 自由 度 f 一 二 PLP 十 D)， 这 与 定 


理 5.2 是 一 发 的 。 其 它 请 名 也 是 如 此 ， 读 者 可 以 自己 去 验证 。 上 
述 规律 对 第 六 章 中 男 归 系数 算 阵 的 检验 也 同样 成 并 


习题 五 


5.1 为 了 科 验 其 化 验 员 的 化 学 分 析 是 次 有 系统 误 盖 ， 今 取 四 个 等 级 的 
铁 逆 石 标 样 。 到 个 等 级 的 铁人 矿 石 的 铁 的 会 报 用 西 维 何 量 x 三 rs) 
表示 。 设 其 均 信 向量 为 Ex = 二 《22.75，。32.75，51.50。61.50)4 并 概 
定 * 为 四 维 正 恋 疝 县。 让 化 哈 员 对 标 样 进行 分 析 , 每 次 化 验 从 低 到 商 年 复 
化 验 21 次 :根据 化 的 的 数据 计 让 得 

F2282, 32.79, SL.d45, §1.38) 
.02 
9 了 41 0.712 
D.134 OD.22% 0.393 


一 【一 1 \ 
0.253 U238 0.345 GO.806r 
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Ca) 对 于 a 二 0-035。 检 防 化 验 员 的 分 析 与 册 是 否 有 暗 赣 鞋 吾 ? 

人 车 有 三 查 莹 哎 ， 分 别 用 一 元 的 寺 答 验 法 对 上 个 均值 分量 分 别 检验 ， 
以 帮助 判定 (o2 中 的 荤 异 是 来 自 哪 一 个 等 级 标 样 (a 一 0.05). 

Ke 求 出 北 验 员 让 四 个 等 激 中 化 验 沟 信 的 0.95 3onferroni 置信 区 间 
《 取 "(20) = 了.607 )。 


5.2 【成 对 出 较 ) 有 时 两 总 体 的 样品 必须 成 对 地 出 现 才 能 帮 比 较 . 组 
{的 试验 数据 , 令 可 一 生 一 Je 二 ea 
a 处 闻 ; 并 服 忆 和 CB,FNE> 0y 未 知 》. 

《a)] 用 似 然 比 方 波导 出 检验 很 设 对 一 D 是 50 的 检验 统计 量 。 

《2 导出 上 5 的 疡 个 分 明和 的 Bonferroni 置信 区 间 ， 

5.3 依照 环境 保护 法 ， 汽 水 必须 经 过 处 理 这 到 规定 标准 才能 排放 ， 其 
工厂 化 验 室 及 环保 部 门 化 验 罕 对 该 三 的 11 个 水 样 进行 测试 ， 深 试 酚 个 指标 

x 一 生化 氧 ，” 一 县 汪 国 休 人 号， 其 数据 如 下 下; 


OC 样 导 | | | 
一 1 2 3 #4| 5 在 7 | 8 9 1 | 11 


化 监 剖 -. 
_ Sm re 
[x si Gia!l gl1t|34|28|71| 43|33|20 
广 化 验 宝 [一 | | - 
x | 27 | 33 64 | 44 1 30|73| 26 .124 54|30| 14 
zy | 25 | 28 | 36| 35 i15144|42 i 54 | 34 1 29 | 39 
环保 化 验 室 一 一 一 一 一 -一 


| i3 | tt 32 1 29 | 31 1 看 二 30 | 64 536 | 20 | 21 


Ce) 利用 习题 5.2 给 出 的 成 对 比较 法 检验 两 家 化 验 室 的 分 析 关 果 是 否 
一 至? te 一 0.05) 

(C5) 落 不 一 致 , 有 孙 出 在 二 [6561] 一 fn 一 As 一 ai] 的 9.95 
Bonterroni 筷 信 人 区 闻 ， 茹 中 piospns 在 一 132 分别 表示 两 个 化 验 塞 所 油 的 
上 竺 履 氧 及 点 祥 国 体 量 移 总 体 均值， 

5.4 设 x 一 NCp,E)， 了 >0 且 未 知 并 一 1。 23499 是 从 该 总 体 
抽取 的 容量 为 st#>p} 的 样本 、C 为 已 知 的 上 x 户 阶 答 降 ， Kp 中 0) 一 
tp 为 已 给 定 的 了 维 同 量 , 要 检验 假设 

HiCp 一 CR Hr 《CH 天 Ci 
试 导 出 这 个 检验 的 全然 比 统计 芒 ， 
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5.5 为 了 判断 两 个 不 同 产地 的 总 尾 矿 是 否 必 于 一 个 种 ,各 取 了 50 个 梯 
齿 训 晤 了 *, 一 壮 移 芯片 长 ，x; 一 苯 生 党， 二 性 淤 长 ，x, 一 花 汶 宽 , 项 
望 出 较 这 些 形 态 上 的 差异 是 拘 显 著 。 作为 一 个 分 当 的 依据 ,由 测 得 的 数据 算 
得 两 地 的 样 术 均 入 向 量 为 
X= (5,.9036, 2.770, 4.260, 1.326)° 
ER ee C5 0006 3.428, .462., 0.246) 


及 


9.6012 
下 
A = DY Cn sy Ey 5.0067 3$.8823 
ET 4.7654 2.8001 6.1919 
1 


S011 1.3025 1.9026 1,3118 


fs 
5 
一 >) Cxl ww OK 一 EY 2 4.9289 5.9835 
1 4.9980 1.8231 6.1059 


3B3 L1721 1.0768 1.1485 

C4)》 设 两 地 草 尾 花形 乱 的 协 片 差 隆 相等 ,对 于 a 一 0.05, 判 断 两 地 态 必 
花形 沪 均 值 向 若是 否 有 显著 差异 ? 

Ce》 落 有 三 著 差 异 ， 求 出 两 总 体 询 值 向 晶 茎 各 分 量 的 由 名 Bonierroni 
置信 区 间 . 

5.06 证 > 一 【mi9gas 和 3 玫 人 表示 愉 北 , 东 , 南 、 西 四 个 方向 销 入 软木 笠 
所 得 的 软木 量 。 证 Ex 一 只 一 《pump 设 x* 服 从 正 态 分 布 ， 现 观测 
了 10 秩 持 ,并 计算 了 样本 均值 向 量 及 苏 方差 阵 为 


E06, 0.93, 0.99, 0.93y 


一 4 一 3 Xi 一 中 一 EY 
3 一斑 4 了 立 《xi — Ex 一 到 


j= 
0.704 
i110.39? 0.721 
9 10.486 0.483 0.609 
‘0.352 0.401 0.393 0.541 


对 于 a = 0.05, 检 验 抽 二 山王 记 一 是否 成 立 ， 
#2 是 从 正 态 总 体 Np Ch， {> 
用 未 岳 ? 抽 下 的 样 平 ， 证 


2 


上 LL ,1 
PF. 和 ee )， “一 人 2 ) 
其 中 gp 是 维 癌 名 各 81: 是 疡 x 了 阶 算 穆 ; 试 作出 稳 验 候 设 
Hupp 一 pO Hsp sen) 


的 检验 方案 ， 
5.8 为 了 研究 茜 正 市 男性 高 中 学 生 归 烟 间 题 、 随 秽 抽 取 了 300 个 高 中 
男生 ,调查 每 天 吸烟 量 结 果 知 下 表 


试 对 这 四 特 情 况 的 人 的 比例 所， i 一 12,3,4 (D2 py 一 1) 作出 95% 的 同 
时 置 售 区间。 ™ 

3.9 证 朋 定 理 $5.3、5.9 和 5.11。 

5.10 ”利用 习题 5.3 的 数据 , 检 恰 厂 北 验 室 (第 一 总 体 ) 与 环保 部门 化 验 
宣 (! 第 二 总 体 ?的 协 方 莽 阵 是 否 相等 ta 一 0.05)。 

5.11 利用 习题 5.5 的 化 据 检 验 两 地 的 贷 尾 攻 形 态 的 协 方差 阵 是 否 要 
等 {a 一 0.05)。 

5.12 设 9 让 一 19290r98CR>P) 为 总 休 NaC， >0523 荆 都 
未 向) 的 样本 , 试 导出 检验 假设 

HusE = disglo sya ps}y HurEmdiag(d ,yds dpe) 


的 似 然 比 统计 量 为 4 二 |EI” ,其 中 民 为 样本 相关 系 效 泪 阵 。 
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第 六 章 ”多 元 线性 统计 模型 


在 一 元 绕 计 分 析 中 ， 同 归 分 析 与 方差 分 析 是 应 用 最 广泛 的 综 
计 方法 。 在 多 元 统计 分 析 中 也 是 如 此 ， 多 元 回归 分 析 与 多 元 方 盖 
分 析 都 属于 多 元 线性 统计 模型 在 本 章 中 将 介绍 多 个 自 变 量 与 多 
个 国 变 量 竟 回归 问题 , 它 包 括 回 号 模型 的 参数 佑 计 、 检 驻 、 回 与 预 
测 以 及 自 变 量 的 逢 选 ,最 后 再 介绍 多 元 方差 分 析 - 


$ 6.1 多 元 线性 回归 模型 
在 一 元 统计 中 也 有 多 元 回归 分 林 之 称 ， 它 指 的 是 多 个 自 变量 
对 一 个 固 变 量 ( 简 称 一 对 多 )。 设 x 为 因 变 莉 ， Vi 2 "se 为 4 
个 自 变量 ,一 元 统计 中 的 线性 回归 模型 为 ; 
* 二 十 98% 十 "十 Ox 十 & 
{ 4 (C1.1) 
E(s} = 0 varte) = oi, . 
若 我 们 已 得 到 为 组 独立 观察 值 《xi EA “5 fi 一 1 
z。， 对 于 这 ”组 观 绎 秆 ,模型 (1.1) 可 叶 为 


一 0 
E(E) = 0, var(£:)— a C1.2) 
1 = 一 1l,2.*° 玫 
记 
和 Do {5 E 1 I 
一 | 各 ,日 一 已 ， i ， 多 : 2 as 
0, 2 EF EP "Zon 


则 模型 K1.27 可 与 为 


" 区 了 


全 = ZO+e 
El) 一 和 cove) 一 GT 
我 们 称 工 为 设计 第 阵 , 旦 设 引 Z 一 9 十 1 二 wn,， 称 x 为 # 维 观察 
向 最 , 驯 是 4 十 1 维 未 知 参数 ， 称 为 回 了 归 系 数 向 量 ,，e 是 # 维 非 观 
察 值 , 它 代表 随机 误 东 ,其 分 是 ej(i 一 1,2,-…,7) 相互 独立 同方 
差 《未知 的 )， 众 所 周知 ， 在 一 元 绕 计 中 就 是 要 在 记 给 的 7 及 x 
之 下 对 介 及 er 进行 估计 ,建立 回归 方程 ,讨论 倘 计 的 有 关 性 质 , 若 
在 正 态 假设 下 ( 即 假设 x ~ N。(Z 介 ,ao7,) 或 ~ NCo,01.)) 
还 层 对 回归 系数 进行 检验 及 预 溃 精度 的 讨论 . ， 

人 在 多 元 绕 计 中 多 天 回归 分 析 是 指 多 个 自 变 量 对 多 个 因 谈 最 
(简称 多 对 多 )。 六 实际 十 作 中 常常 要 考察 渭 对 多 的 问题 ， 例 如 在 
炼 钢 过 程 中 , 灾 考 罕 钢 的 售 碳 量 ， 售 硫 量 ,… 等 等 与 治 炼 初期 天 然 
分 石 品种 ,熔化 有 时间, 熔化 温度 ,… 等 等 之 间 的 关系 ,这 就 是 多 对 多 
问题 ;在 地 质 学 ,气象 学 、 生 物 学 和 医学 中 也 都 会 碰 到 类 似 的 多 对 
多 的 问题 ， 与 一 元 统计 中 的 一 对 多 回归 分 析 一 样 ， 首 先 给 出 多 对 
多 的 线性 回归 和 寞 型， 

设 有 个 因 变 量 x.,x2,…… ,xs; 有 9 个 自 变 最 3320 和 94. 
假 宏 每 个 因 变 量 zi (i 一 1,2,+'…,P》 都 有 自己 的 线性 回归 模型 ，. 
媳 


(1.3) 


a C1.4) 
Xp Dop Tt Op 1+ tt Opra + Ep 


C1.4) 式 中 的 每 -个 等 式 就 是 一 个 一 对 多 的 回归 模型 ,这 里 可 注意 
的 是 (1.4D) 中 每 一 个 随 记 误差 gs 人 一 12 2) 是 相关 的 , 即 它 
们 满足 
五 (6 0, Cove Ei 一 GO 一 12 【1.5 
为 了 今后 讨论 的 方便 可 将 (1.4) 与 (1.5) 式 写成 短 阵 形式 : 
下 一 Wz C1.6) 
El) = 0, tir(€) mE— (gi pxp C1.7) 


EE 一 do 十 Oz 十 … 十 da 


* R22 * 


其 中 


如 上 条 对 罚 变量 


Bo, 有 
日 一 世 2 |— 0, 0, 
Wu 9, -Oop 
CE 1 8S) 
x—| 守 | zl el 
‘Xp 3 s, 


冯 设 计 关 组 不 可 的 值 z; (fj 一 1,2， 


zj 之 下 因 恋 量 x 可 得 到 = 个 观察 向 量 好 站 一 1.2 
设 每 次 观 罕 都 是 独立 的 ,我们 


…,#)， 环 入 在 
1), 且 假 


证 阵 形 式 表示 。 记 


EA in x 
。 (2 
pL X22 Tn | Cx,, Xr, “eX ) 一 | <* 。 C1.8) 
Kp: Kp2- “Tp te 
它 迄 因 变 量 观 察 算 阵 , 是 巡 X # 阶 . 
1 1*:*"*1 Tr 
。 Cd 
Z 一 | 《1.9) 
和 gs Kan FA Ei 
它 是 自 变 量 设计 算 阵 ,是 《9 十 1) Xs 阶 ， 
A Be 0， 人 区 
oe 《3 
日 一 | 9 9 9 |- (6966 一 |2” | ci.10) 
Do。 有 O'sY 
它 景 问 亿 系数 让 阵 , 是 z xX C9 十 1) 阶 ， 
ED 让 人 "Ey EY 
. 。 《ay 
一 | aS | 一 (ee se) 一 | . 《1.11) 
Bp, Ep2° “pn 7 


* 人 人 了 


名 是 误 美 矩阵 ,是 立 X 关 阶 。 
对 于 站 次 独立 观察 ,模型 (1.6) 及 (人 (1723 可 写 为 
发 一 外 Z 十 号 
CO vecE] 一 了 的 【或 RE 门 一 0，covfei = ZF, (1.12) 
covCe led) 一 ol ) 
(1.12) 式 称 为 多 对 多 线性 回归 模型 。 在 实际 应 用 中 往往 称 C1.8) 及 
(1.9) 式 为 资料 答 降 ， 如 果 当 一 1 时 , 则 (1.12) 变 成 
x oo OF EY C1.13) 

”其 中 x ,Ge 分 别 为 天 , 日 和 e 的 第 一 行 向 量 ， 经 续 置 后 
就 得 到 


人 一 780 十 el 
(ECE = 0, cov(e TT) m Ol, 
关中 > 是 王 的 第 一 行 第 一 列 元 宫 . 风 误差 癌 量 e 的 第 一 个 分 量 的 
方差 .C1.14) 式 正 是 一 对 多 的 回归 槛 垄 (参看 (1.3) 式 ), 
有 了 多 对 多 回归 模型 (1.122 后 ,我 们 要 做 的 工作 是 ; 
(1》 用 最 小 二 飞 盐 佑 计 回 归 系 数 扩 阵 印 , 给 绸 王 的 无 由 估计 ， 
从 而 建立 回归 方程 ( 预测 方程 ) 并 讨论 估计 的 以 质 . 
《22 在 正 访 假设 下 , 即 在 
K~ NnQZ,E,1,) 《1.157 
之 下 给 出 日 及 互 的 极 大 偶然 估计 ， 对 回归 系数 进行 检验 菩 及 讨论 
回 妇 方程 预测 精度 的 估计 ， 
《3) 讨论 起 变量 的 筛选 后 题 . 
多 对 多 线性 后 归 绕 型 中 ? 个 自 变量 都 是 可 以 确定 的 实 变量 ， 
这 种 模型 用 于 建立 回 妇 方 各 ， 以 便 通 过 自 变 景 的 实现 来 对 相应 的 
因 变 量 进 行 预测 或 控制 .如 昌 寞 型 中 的 白 变 量 是 二 态 变量 ( 邯 它 们 
只 取 04 或 1), 它们 的 取信 可 由 试验 设计 来 确定 ， 这 种 模型 用 于 分 
析 各 个 容 变 量 对 二 变量 的 影响 如 何 , 这 就 是 多 元 方差 分 析 ,我 们 将 
在 本 章 的 最 后 一 节 来 介绍 
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C1.14} 


§ 6.2 多 元 线性 回归 模型 的 参数 估计 


(一 ) 最 小 二 乘 基 计 及 其 性 质 
由 入 型 41.12256[ 乔 出 ,对 误差 向 量 愉 要 求 二 阶 抢 存在 , 无 须 对 
它 的 分 布 作出 想 设 ,在 此 情况 下 可 利用 最 小 二 涤 ( 简 记 LS) 方 靶 
估计 名 ， 我 们 千 回 顾 一 下 在 一 元 统计 中 的 工 S 佰 计 ,在 一 对 多 的 楼 
型 (1.3) 中 设 回 妇 和 系数 向 量 8 一 (86,9,, DJ 的 LS 佑 计 为 
站 一 (6,,-… ,和 6) ,各 是 使 得 误差 平方 和 
SO) ~ (x — ZO (x — 2°0) 
达到 极 小 , 即 台 满足 
0O~(x— ZYx— 26) 一 min (x — 2'0Y (x — 2’0) 
一 min SCO) C2,1) 


上 式 中 0 称 为 残 差 平方 和 ， (x 一 2 自 ) 称 为 残 差 向 量 。 由 极 值 
庶 球 及 第 一 章 的 (4.3) 和 (4.4) 式 有 
050) 0 (x Oyx 一 
36 36 ZGY(x — ZO) 
em 27X— 2770=0 


从 而 得 汉 
ZZ2'0— Zx 《2.2) 
称 f2.2) 式 为 正规 方程 组 ,车 1ZZ 1 夫 0( 即 站 工 王 9 十 12， 刚 
《22 2， 储 在 ,这 样 便 可 求 得 9 的 LS 估计 为 
~ (ZZ) -zx 2.3) 


或 转 置 为 
人 一 区 EDZZ 1 {2.3Y 
在 多 对 多 的 模型 (1,12) 中 对 于 每 一 个 因 变 量 都 对 应 着 一 个 一 
对 多 的 模 卉 


i) PE ad LE 十 El 
ElE = O, COVCETY) = gnd, C2.4) 
i112 fp 
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其 中 x 和 用 (18)(1.117 式 确定 ，ai 六 了 的 第 i 个 对 
角 线 元 素 。 对 士 (2.4) 中 每 个 z 都 有 一 个 况 莽 平方 和 I 

iD 一 - Cx _ Bo 本 ZG Ci = | ,Pp) 
?个 误 基 于 注 和 为 

S98) 一 3 So 人 (ze 一 CONCxzo 一 2000 (2.5) 
多 对 多 模型 的 回 凡 系数 矩阵 名 的 LS 估计 铝 就 是 使 得 (2.5) 式 达到 
禄 小， 击 于 SLB?》 都 是 平方 和 , 因此 点 使 SCB)》 达到 航 小 等 价 
于 每 个 8SKB8) 达 色 极 小 ， 由 (C2.3) 郑 道 对 十 每 个 SC6") 使 其 
达到 极 小 的 8? 为 


tir 一 FEED 人 一 2 的 (2.6) 
这 样 便 得 到 昌 的 LS 估计 沪 
Be 
纺 一 和 一 KRALL (2.7) 
py 
显然 , 当 rkzZ 一 9 十 1 时 ,2.77 式 是 方程 
BCZ2) 一 居民 . (2.8) 


的 唯一 解 ， 称 《2.8) 式 为 区 对 多 的 正规 方程 组 ， 荐 rEZ < 了 十 | 
时 ,正规 方程 组 有 不 定 解 ,可 用 广 辫 逆 表 示 如 下 : 
= XZ(ZZY (2,9) 
定理 2.1 模型 (1.12) 的 回归 系数 矩阵 日 的 s 估计 加 满足 
{1》 对 于 任何 非 零 了 维 向 量 ! 有 
CX— 02HX — 6Z) 一 minl' CX 一 BZIX— ZY (2.10) 
(2) 使 误差 的 交叉 结 积 答 阵 (一 8Z)(X 一 侣 Zz》 的 迹 达 
到 芭 小 , 即 
tC C—O — $2) 一 min tr BZHK — HZY C2.11) 
《3》 使 广 尽 方 着 1(X 一 日 ZXMX 一 BZ)'1 达到 最 小 , 剖 
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| — BZ2ICX 一 全 2 1 一 min [CX — OZYCX 一 GZY | C2.12) 


4》 在 矩阵 非 负 定 意义 下 ,对 怀 意 台 , 有 
【下 一 站 ZX — ZY EX 一 四 ZX 一 四 ZE (2.13) 
《5) 用 4《A) 袁 示 矩阵 4 的 最 大 特征 根 , 对 任意 日, 有 
OX — SINK ~ O27) SUAN 一 加 2 — HFYY (2.14) 
证 有 明 ”我们 就 (1) 给 出 证 明 ,{2)~(5) 留 给 读者 。 
在 (2.7 ) 式 两 和 达 右 匈 《ZZ)7， 然 后 移 项 便 得 
XZ 一 GZZ RBZLIZ 0 {2.15) 


从 而 也 有 _ 
PAS (2.16) 


对 性 意 的 了 维 非 零 向 量 ,并 注意 到 C2.15) 及 (2.16) 起 ,有 
(和 一 名 ZX — G2ZY1 
— {i[(X— 82)+ (GG — O22)CX 一 与 2 + (8 — 02 
= (XxX— ZIMX 一 加 ZTE 
+ e0772(6— ol 《2.177 
注意 到 


(后 — 22H — O00 
从 而 对 一 团 晶 及 (2.17) 式 ,有 
(XX— ZYNX — ZY EX — ZHNX— G2 

这 样 (1) 便 得 证 ， 目 

根据 上 述 定 理 ， 多 对 多 回归 横 型 (1.12) 的 久 归 系数 矩阵 印 的 
LS 估计 是 有 多 种 含义 的 。 定理 中 的 任 一 种 情况 都 可 作为 @ 的 LS 
估计 的 定义 。 

由 正规 方程 组 (2.8) 求 得 @ 的 LS 估计 和 外 后 , 这样 便 可 建立 多 
对 多 回归 方程 (预测 方程 六 


中 一 上 z 《2.187 
将 (2.18) 具 体 写 出 便 是 


= 十 BB,z, 十 十 
ee, 人 (2.19) 
和 一 名 十 6 十 十 


* 227 * 


将 前 面 已 知 的 设计 年 冬 的 = 个 列 向 最 zi; 得 一 2) 分 别 
做 大 《2.193, 并 写成 讶 阵 形 式 , 就 得 到 相应 药 回 归 信 (预测 值 ) 侍 阵 
大 一 加 2 XZ(ZZN) IZ 《2.207 
实测 值 算 阵 X 与 预 混 值 拭 阵 和 之 莹 
EAZ(ZZ)IZ 一 天 (人 一 ZEEO ID) 
C2.21) 


称 为 残 效 密 阵 。 而 称 
OE KAICKX— RY 
a ROT ZEIT — RZ YY II 
= ROE 一 (ZE DZ 2.22) 
为 残 差 交叉 对 积 夭 陈 。， 让 于 
(1 ZZZIIZIZ m2 2 0 
下 利用 (2.20)、(2.21) 式 ,有 | 
EZ = NO ~ BIHINIIL 一 1 (2,.23) 
EN’ oo RET PLEN ZIZ ZI IIE 0 《2.243 
上 上 上面 两 式 说 明 残 差 矩 阵 与 设计 短 阵 、 预 测 值 答 屠 和 的 行 向 量 之 喇 是 
正 交 的 ,于 是 就 有 
由 凡生 {2.25) 
注意 到 ZEQE DT 2Z 正 是 在 {2Z'》 上 的 投影 隆 Pz， 从 市 的 
每 一 行 向 量 都 是 五 的 行 向 量 在 绑 玉 2 个 上 的 投影 , 即 
E == PoleeryK 
下 人 面 的 定理 2.2 给 绰 了 LS 俏 讲 及 残 莽 交叉 蒋 积 矩阵 全 的 
有 关 性 质 . 
定理 22 车 rkZ 一 9 十 1， 则 


(1) EG ~ 8 (2.26) 
EBD 一 (er 一 9 一 1 《2.277 

即 台 是 日 的 无 偏 估计 , 二 一 二 了 是 的 无 偏 信 计 . 
C2) covlvecd) = THOZLLY' ‘2.28) 


" 4228 + 


cov (OOD 一 og 2°)! C2.29) 


(3) 8 与 & 互 不 祖 闫 ， 
证 明 ”出 模型 (1.12》 有 
EX= E(97Z 十 6 ~ 87 
所 以 
再 后 ECXZCZI)) 一 加 ZEZZOT 一 外 
这 俩 基 (2.26) 式 , 记 
Pi— 2Z(ZZY)'Z 


显然 PP 晨 措 影院 ,月 rr PP 一 ttrP 一 gz 一 4 一 1 和 ZP = 已 2 一 


0， 记 吕 的 元 素 为 gy， 四 模型 (1.12), 有 
EleY = ECX — HZ) = 0, H EleDeD’) = ol, 
由 (2.22) 式 可 看 出 , 台 可 表 成 
Oo XPX = (X— O02)P(X — 82) 一 号 Per 


从 而 有 
Eq 一 EleiY Pe — E(treiY Ped) = BltrPe er ) 
tip Ele el)] == trLPosl,l 
— on —49— 1) 
所 以 
五 站 一 (ae 一 ?一 1 了 
这 便 证 明了 (2.27) 式 。 
按 第 一 章 定理 1.1, 由 一 ZK《Z 2 小 '、 所 以 
vec = (TITZY) !F vec 
而 由 《1,12) 知 cov(vYec 天) 一 了 的 !， 利 用 第 二 之 二 弄 ! 1.4, 有 
covivec BH) 一 CBZIN Znv (vee KHATRIZ ZY LY 
= (IZLE THIBDNDU OE (ZE) ') 
— ZOLZLD)! 
《4.28) 式 得 证 忠于 
YeCE = vec RP = (TOP)vecE 


sa 220 。 


记忆 
cov(vec Bovec 6) = cov (TOTZN TIN, IO PYvec XX) 
= {TOZZI YL) covtvec RY + (IOPY 
(OZLNZ) (SOON?) 
— FOZZIZP ~ FBI 0 
上 式 说 明了 介 与 & 互 不 相关 ,定理 得 证 。 是 
注意 到 , 若 rk2Z < 十 1。 由 第 一 章 定 理 3.5 知 ZZ2') 2 
是 唯一 的 在 择 (Z 7 上 的 投影 阵 且 秩 为 rk2E， 如 上 证 明 可 得 
EQ = (rn — rkZ2)F 
不 面 我 们 将 考虑 预 镁 问题 厅 关 的 估计 。 
由 最 不 二 乘 法 我 们 已 给 出 了 四 和 互 的 估计 ， 并 建立 了 回归 方 
程 (2.18) 式 .更 给 自 变 量 以 新 的 值 mm。 根 据 回归 模型 ,有 
Xo 一 HZ, 十 可 
其 中 x, 是 相应 于 z 的 因 变 量 观察 向 量 , ee 是 误差 疝 量 ,上 且 Eeo 一 
O, OvVEELY — EB, Cov (gO 6) 一 0 (一 1， 2 MoSe 
不 相关 。 上 出 预测 方程 可 计算 出 在 如 之 下 其 预测 值 为 
总 ,一 位。 


而 预测 误差 为 
Xo 一 这 一 2 一 各 zo 
于 是 
E(xo CO— RR) 一 五 xi ~ FOz, 一 Hz 一 四 Zn 0 

这 说 了 明了 名 是 如 级 一 个 无 仿 预 测量 ， 而 预测 误差 的 协 方 六 阵 
一 《51#) 可 可 下 求 册 : 

有 由 于 x 与 久 (&0 与 在) 互 不 相关 ,所 以 

covCE, — 鞠 ,) = COVv(Xy — BE) 一 covfx) + cov{ Bs) 


Di . 
Coy( 丰 2 一 cov((T OFNYrecG) = (OrcovivecO YT OZ) 
— (OZOHOLZLY) NO "= EOIALL Y's 
BTL) tm 


= 230% 


由 于 SOVKX) 一 时 
所 以 有 
去 一 covfxn CO— Rl ZY (2.30) 
(二 ) 极 大 似 然 估计 及 其 性 质 
在 (一 ?中 讨论 的 LS 估计 ,对 模型 没有 作 分 布 的 假设 , 如 果 我 
们 对 模型 作出 正 坊 分 布 的 假设 ， 此 时 可 利用 极 大 似 然 方法 求 得 B 
和 旺 的 极 大 伺 热 估计 ， 并 将 看 到 鱼 的 LS 估计 与 极 天 似 然 估计 是 
一 致 的. 
定理 23 在 学 对 多 的 模型 (1.12) 中 , 设 X~ Ny.(BZ,2,1) 
(或 8 ~ Npa(0,2,1) rkZ 一 9 十 1 #— (4 十 1) 守 pp， 则 台 
和 了 的 极 大 似 然 估计 是 
汞 一 和 ZEZZOT 《2.317 


三 =- 二 2 一 二 〔 — ZZ'E) {2,32) 
和 证明 当 其 一 本 和 ZE 时 , 它 的 倍 然 了 消 数 为 
L(B,T) 一 【27 "| 


X exp ur |- 立 SA 一 @ZJX 一 ez)|} 


me Cx) se | py | 一 上 


X exp I [- 村 EX—BZIX— GZY 


十 (人 一 6)Z2Z'(6 一 8@}) |} 


其 中 入 一 XZ0EE 
由 于 对 非 负 定 人 第 阵 4 二 CC ， 有 +t 54 之 0， 所 以 
ti-(0—8)27 (0—0) 一 trCC 0 (C=2 i(6—8)2) 
显然 上 式 当 如 一 达到 办 小 值 0 ， 又 由 第 四 章 引 理 1.1 知 , 当 夺 一 


一 如 时 ， 世 (6,2>) 达到 最 大 ,从 而 
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L(G,3) < LO,2£) 
即 自生 是 和 了 的 极 大 似 然 估计 ， 虱 
关于 外 和 三 一 二 日 的 分 布 有 下 而 的 定理 。 


定理 2.4 当 XX ~ NBZ,Z1), 2 > 0, 1 (I+1)> 
P， fkZ 一 9 十 1， 则 有 下 列 结 诊 : 

(1) Bo XZ(ZLOTT ~ Neier ECZ2Z) 1) (2.33) 

(2) Oss ~ Wn m4 1,2) (2.34) 

(C3) 音 与 六 相互 独立 

证 明 记 8B 一 Z(2Z2Z ， 按 第 二 章 定理 4.1, 有 有 

Go— XB~ Nc BZ2B, ,BB)Y 
由 于 ZB 一 Jn B88 一 (ZZ')!， 从 而 (2.33) 式 得 证 。 
1 OO = XC, CO— ZZLZY ZIN = XPX, 其 中 PP 一 1, 一 
ZTEZ -IE 是 没 影 阵 , 是 kKP 一 pn 一 4 一 1 而 8ZP 一 9, 按 
第 三 章 推论 2.7 知道 
如 一 本 pm 一 9 一 1)27) 


从 而 (2.34) 得 证 . 
记 GG= XP, 又 各 二 六 ZXAZZ')!:， 田中 的 定 兴 ,有 
BE Tv ZZZ) 0 
根据 第 二 意 定 理 4.2 便 知 交 8 与 介 相 互 独立 ,于 是 中 一 GCC” 与 
看 也 相互 独立 ， 国 

甘于 预测 问题 有 关 的 估计 在 还 态 假 设 下 有 如 下 结论 : 

《1 2 的 预测 值 和 一 四 ~ NCB ZZ Zz 2) 和 
用 第 二 章 定 理 4.1 使 可 得 出 )。 

(2) 预测 肖 荆 (xu 一 20) ~ NC0,(1 十 200ZZ zo)2).( 这 
是 由 于 xo 和 总 一 6s, 均 为 正 访 分 布 且 粗 互 独 立 》。 

例 2.1 要 购买 计 算 机 陶 公 司 为 了 于 定 所 需要 的 设备 ,公司 的 
技术 人 员 从 同 奖 的 公司 收集 数据 ， 忆 建立 计算 机 茎 件 设 备 的 蕊 测 
方程 ， 其 数据 如 表 2 其 中 羡 王 捕 客 指令 4 以 干 条 计 )， 对 一 插 
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盘 输 入 /输出 能 力 ， 


家 2.1 计算 机 数据 


有 123.5 146.5 133.9 128.5 151.5 136.2 C92.0 
2 | 2.108 9.213 1.905 0.813 1.06E BB.6t3 1.125 
4 141.5 168 .9 154.8 146.5 172.8 160.1 108.5 加 
二 3 301.8 396.1 328.2 307-4 362.4 369.5 229.1 


由 表 2.1 不 难 号 出 设计 算 姓 和 区 变量 疯 副 矩阵 为 
1 1 上 1 1 1 1 
Z|1235 146.1 133.9 128.5 151.5 136.2 92.0 
2.108 9.2]3 1.905 0.815 1.061 8.603 1.125 | 


Co 68.9 134.8 146.5 172.8 160.1 2 ) 
301.8 390.1 328.2 307.4 362,4 369.3 229.1 


并 计算 得 
8.17969 ~—0.06411 0.08831° 
C22 一 | -0.06411 0.00052 —0.00107 
0.08831 -0.00107 0.01440 
由 Q2.7) 式 求 得 占 吧 系数 矩阵 介 的 工 5 估计 为 
. 8.42 1.08 0.42 
6 KZ(ZEYT ( ) 
14.42 2.25 5.67 


从 而 回 妇 方 吾 为 


ER _ 8.42 1.08 0.42 1 

受 一 ( ) = Hz 一 ( ) 3 
如 14.42 2.25 5.67 

| 


( 8.42 十 Od + 42) 
14.42 十 2,25%, 中 5,.67x2 
而 的 极 大 似 然 值 计 为 
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5.80 5.30、 
5.30 13.13 


< i , 1 1 
(OK — 6220)— ( 
(0286 9571) 
0.7571 18757A 
注意 到 在 上 述 讨论 的 多 对 多 回归 模型 :日 一 (6,0...9,), 今 
后 我 们 在 邓 回 好 系数 的 检验 各 估计 中 更 关心 的 是 让 变量 z 所 对 应 
的 系数 《0 有 9)， 为 了 更 方便 地 求 出 C6， 入 .0,) 的 佑 
计 , 我 们 把 多 对 移 粹 型 监 守 戌 为 


1 
Xe(2)3s 
gr~ Nps Ea) 
其 中 日 一 (9 8*)，8@* 一 (0, 全 -…- 和 )， 2 一 《ZZ,) 《和 注 
意 到 这 里 2 与 (1.12) 中 的 Z 的 差别 ),， 1 一 《1, 1 1)。 令 
Zx 一 -一 了 1 一 (CT 一天- 2, — 2) 2P (2.35) 
ic 一 如 -二 OO*z (2.36) 


其 中 一 十 DZ Pt 二 1.1;， 这 时 上 述 寞 型 可 写成 
， 
区 一 (eex] (te 
Zr (2.37) 
E ~ NaCOs ES,1s) 
假设 zk Z* 一 g， 注 意 到 Z*1, 一 Pl 一 0， 这 时 (a8*) 的 
LS 估计 为 


。 i 0 YY 
(80) — xGL2r)( ”rapw ) 


一 入 Xl, XZ*Z*2*)") 
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-LSx- 
2 Xl 7 部 {2.38, 


OB* 一 XZCZHIE YT (C2.39) 
由 (2.36) 可 得 
站 一 于 一生 + 于 {2.40) 
显然 (2.39) 式 的 6 是 下 列 方程 的 解 
各 由 LzB* em Lrz {2.41) 
Lzz = ZZH, Lrzm NE” 《2.427 
由 第 二 章 定 理 4.1 知 
B+* ~ NB*, F(Z*2™)) 《2.43) 


此 时 残 差 交叉 乘积 矩阵 (2.227 可 表 为 


1 LY 
o- [x—ca0") (2)] [x -a0 (2) 
ws PE' — RE DIT)TIZN 
一 XIP 一 PS(ZPE YI GPIN’ = KRX (2.44) 
其 中 
RP — PCSPZ)SP (2.45Y 
容易 证 明 民 是 办 等 对 称 阵 , 且 rkR 二 # 一 9 一 ,所 以 名 ~ W， 
(Cn 一 9g 一 1,Z)， 且 与 (8&6*) 相互 独立 , 于 是 出 (2.43) 式 ,有 
(8+* 一 BICZtERNACOF 一 四 ~ W,(Ca,2) 
且 与 台独 立 。 此 时 如 果 2 一 1 < 一 1， 则 有 


3 一 :SS a/ 人 ~ 和 一 
16,— ol Bs 5/ ~ Fe 一人 (4 


*( 三 ) 美 于 合 的 线性 函数 的 估计 

前 面 对 回 归 系 数 和 矩阵 @ 和 人 协 方差 沦 阵 了 的 估计 进行 了 讨论 ， 
然而 在 zZ” 不 是 韭 奇异 矩阵 时 往往 会 带 来 一 些 问 题 ， 而 在 一 些 
具体 问题 中 有 时 只 要 求 对 日 的 某 个 线性 函数 进行 估计 ， 下 面 将 对 
这 个 问题 作 一 些 探 讨 。 
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仍然 考 碟 多 对 多 回归 嵌 型 【112》， 
定义 2.1 设 踢 元素 的 级 性 遂 数 


-+t 

™" 

= EE 和 
站 tr 四 过 | 


如 果 存 存 苞 元 素 的 线性 冰 小 trXB， 使 得 
EtrrXP=triAPp 

则 称 P 呈 可 信 的 ， tf 久 B 称 为 ?的 线性 元 偏 估 计 ， 如 采 在 P 的 线 
性 无 篇 入 计 中 存在 方差 最 小 的 估计 ， 则 称 它 是 的 最 优 线性 无 偏 
个 计 或 老 马 尔 科 夫 估计 。 

引 理 2.1 记号 如 上 , 则 

{1) Etr XB tr OF 

(C2) varltr XBY = tr BEB’ 

(C3) covitr XB, tr XD = tr BED 

证 明 {1》 是 显然 的 ， 

《22 记 8 一 (6,.…B,) ,于 是 
tr RB 一 tr xi 一 bp bx 


[| 


由 于 %; 筷 不 相关 且 有 相同 的 协 方 差 和 矩阵 号, 从 而 
Warttr XBY = var S32 br xi】 = » pb sb, 


{=t 


and,r 


一 人] tr Ebb; — tr EBB— tr BEB 


fm 1 


《3) 的 证 明 与 (2) 关 们 . 败 
定理 2.5 p 一 tf 人 @4 可 佑 的 充分 必要 条 件 是 存在 簿 阵 了 和 使 
得 ZB8 一 4 成 立 ， 
证 明 p 一 tf@4 可 佑 的 充分 必 机 茶 伯 是 存在 吾 使 得 
p= tA EItr XB tin 
对 一 唐 晶 成立, 于 是 信 tr8@(4 一 ZB8) 一 0 得 到 
ZB A， 
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下 面 记 6 一 X2Z(ZZ0 蚌 日 花 任 一 LS 估计 【参看 〈2.9 
武 》。 
定理 2.6 对 吓 估 人 参 洲 p 一 tr@4 而 言 ,有 
(1) tI 名 A 是 唯一 确定 的 昌 E tA 一 tr94 
(2) varlttr®B,A) 一 t+ 
证 明 由 于 p 一 tr8@4 可 悄 , 存 在 B 使 得 4 一 28, 而 = 
XZ(ZZ) ZB， ZAZZ)Z 是 ELZ') 下 投影 阵 , 与 广义 逆 无 
关 , 因 而 4 一 XZ'(Z 2 小 +4 唯一 确定 ,(1) 便 得 证 ， 而 
EtGA=t0ZZ2(ZZY ZB = OLB = tOA 
出 引 理 2.1 可 计算 得 
var(tr@A) 一 var(trXZ'(Z2 YA) 
| = tl2Z ZEITA .FACZEY ZI 
一 trCKZZE7 ATA') 
《27 便 得 证 。 国 
定理 2.7CGauss-Markov 定理 ) 设 p 一 trg@4d 可 犀 , 则 irg 4 
是 5 的 唯一 的 最 优 线 性 无 便 估 计 。 
证 明 由 定理 2.6 知 6G@4 是 trg@d 的 无 偏 估计 旦 它 的 方 莽 
为 tt2Z22Z TEA 。 由 于 p 一 trg@4 可 全 , 故 对 它 的 尾 一 无 箭 估 
计 tr XB 有 ZB 一 4， 于 是 
W8EKEY KB) 一 tr BEB’ 一 tr3# B85 
tiiBZ(ZZ2)+Z BE 
= tl2Z NT ATA = varttirG A) 
按 定 必 2.1，tr@4 是 P 的 最 优 线 性 无 偏 估 这、 
下 面 证 锡 叭 一 性 - 记 #5, 一 tr64， 男 一 个 最 优 线性 无 偏 估 计 
记 为 应 一 红 和 8， 则 4A 一 ZB。 于 是 由 引 理 2.1, 有 
covtB Br) 一 covftr KB IrX2' (22 ZB) 
< BSB ZCZZL)T = tL I ATA 
BD vartA) = var(p) 一 covtp,sB)， 从 而 
EB me EB E(B — PB) ~ varlp) 二 va 让 一 2cov(P B17 = 0 
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部 5 天 志 以 概率 1 成 立 。 定理 得 证 ， 量 

定理 2.8 设计 ~ Nja(9Z,3,1,),， Pp 一 t78@ 才 可 悄 , 则 P 
的 怠 优 线 任 无 偏 估 计 

B=tBA~ NrQA,tr(2ZZ TEL 《2.477 

证 明 5 一 6A 一 tr XZ' 必 ZZ')+A 是 联合 正 态 变量 wij 的 线 
性 组 合 , 仍 服 从 正 态 分 布 。 其 期 望 、 上 方差 由 定理 2.7 确定 故 C2.47》 
式 成 立 。 目 

对 于 日 而 言 , 仅 当 每 一 元 素 9;; 可 估 时 才 说 外 是 可 估 的 。 而 对 
于 可 佑 项 数 p 一 tr8@4 而 言 ,尽管 当 ZZ 不 祷 秩 时 LS 估计 不 确 
定 , 但 它 仍 有 最 优 线 性 无 依 估 计 tr@4, 

最 后 我 们 指 负 , 多 元 线性 模型 也 可 通过 把 芒 改 写 汐 vec 无 后 
成 为 一 元 的 广 立 线性 模型 来 处 理 . 【112) 可 写 为 ; 

ff XZ Yvert vece 
Elvec &) = 0, cov(vec &) ~ SOI, 

从 而 一 元 线性 模型 的 结论 都 可 在 多 元 线性 模型 中 适用 ， 读 者 可 自 
行 比较 得 到 ， 


$ 6.3 多 元 正太 线性 模型 中 回归 参数 的 假设 检验 


在 一 元 统计 的 回归 分 析 中 ,我 们 沽 处 了 4 个 自 变量 与 一 个 因 
变量 之 问 是 否 存 在 显著 线性 关系 的 问题 ， 也 考 感 了 每 个 自 变 量 对 
因 变 其 是 否 有 显著 影响 的 问题 。 对 于 多 对 多 的 线性 回归 复 型 也 要 
讨论 这 坚 问 题 , 即 要 对 回 雪 系数 进行 各 种 检验 . 

设 着 一 (X00) ~ Npat 和 2Z, 1)， 其 中 昌 .Z 分 别 由 
(1.9》 及 (1.10) 式 所 定义 并进 ZZ 非 奇 异 且 js 守 p 十 9 十 1。 

(一 】 关于 全 的 子 柜 阵 的 检验 

设 急 一 【回避 四 其 中 国 是 Pp Xx 《9 十 1 一 部 阶 , 钨 ; 是 
PXs 阶 ，(s < 之 49 千 1)， 考 虑 检验 如 下 假设 

Ho: B= 0, Hi:O, 0 {3.1) 
中 检验 办 变量 是 否 依 赖 于 自 变量 ze ze 
238. 


我 们 利用 似 然 比 方法 导出 检验 统计 量 。 此 时 参数 空间 为 
一 {(9,3): 日 为 p X (4 十 1) 阶 矩 降 ， 了 > 中 
似 然 函 数 为 . 
LB,2) ™ (2r) EI 


x exp {tr [— 四 3-(X— GZ)YCX— ez) 


按 定 理 2.3 的 证 明 , 知 当 
一 8 XI(ZZN 


和 和 
EF=s— lo lxX— ZXxX— 07Y 
灯 Ei 


KI, — ZCZZYZIR 
Le 


时 ， 工 (全 ,了 》 达 列 最 大 , 妈 
max LQ@,T) = L(G,2) 


| 


— (C2) -<r 寺 (和 一 GZ)CX 一 6z)| 


xexp(— np) 
在 ,之 下 参数 空间 为 0, 一 {C9,2): 了 > 0，8, 一 0} 时 ， 记 
Z 一 (2)， 其中 宅 .是 (9 十 1 一 从 Xa 阶 ,24 是 1 X# 阶 。 这 
时 模型 为 


KX~ NB ZE,1) 
L(G,, 3) = (2x) we 人 | BI "2 


ols [12x —o,29Cx 一 ez 
间 上 可 知 当 
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,8, 发 Z ZY 
Z w= Fo = 一 Qo, 一 二 CX 一 四 ,ZX 一 ZY 


— 1 XI, 一 ZH(Z,2) 21X 


时 达到 大 大 , 即 
max L{B,2) = L(G,, £,) 


A 


— QO XOZNX— 02)| 
Xx cp( 一 2) 
于 是 似 然 比 统计 量 为 


A* 一 max L(@, 2)/max L(@, 3) ~ C2 1121)-™ C3.2) 


它 等 价 于 下 列 检 验 绕 计 基 
A |Qol/ lo) = 13|i|| (3.3) 
其 中 
Do 一 KET — ZAZII ZT = 
Oo, 一 KX[T — ZZ ZZ I = ns, 
对 于 给 定 的 显著 水 平 a， 当 A 小 丁 相 应 的 临界 入 时 ， 就 放 充 (3.1) 
中 的 原 假 设 站 ， 即 得 于 如 下 定理 : 
定理 3.1 设 下 一 (x 一 N82,1.) 且 x; 相互 
独立 , 全 一 《8,, 昌 ,)， 其 中 全 是 pxt9 十 1 一 站 阶 , 名 是 ?XX 
s 阶 , 则 拒绝 (3.1) 中 的 原 假 设 Ho 的 拒 扳 域 是 由 
4 一 18gl/| 99,l < 4 (3.4) 
给 出 ,其 中 A 满足 PC 志 46) 一 x te 是 给 定 的 显著 水 平 )。 
定理 32 条 件 同 定理 3.1, 则 当 (3.19 中 HH, 为 真 时 ,检验 统计 
是 (3.3) 为 Wilks 统计 量 , 即 
A~ ACpn—g— 1,s) C3.5) 
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证 并 由 CG.2) 和 和 (4.3) 可 知 
Qo 一 XC — POX, Qo = KO — POX 
其 由 P, 是 儿 (ZD 上 投影 阵 ，P, 是 至 (0Z 人 0 上 的 投影 阵 ， 量 
2 一 (Zi12;)， 中 第 一 章 定理 3.7 知道 局 一 PP: 十 只 ， 且 P.R 一 
0, 其 中 R 是 多 [tf 一 PJ,)Z;1 上 的 投影 矩阵 ， 计 以 
Oo = KOT ~ PK = KET — POX XRX = O00+ XRK 
且 
(一 疡 JRc(7 一 户 一 尼 )RR 一 Orkfr 一) 一 z 一 2 一 1 
YKK7 一 五 一 并 一 《9 十 1 一 人 门 ，fK 玉 一 上 
以 及 在 品 成 立 村 
ZKT 一 P 一 0 BZ ~ PY)=0 
由 第 三 童 定理 2.10 知道 在 FH 成 立时 
Qo ~ Wn—9g—1,3) XRX ~ Wl:, 5) 
且 8o 与 XRX 和 相互 独立 。 所 以 按 Wilks 4 统计 量 的 定义 知道 
4 一 |@ol18o| ~ 100ol/ 00 十 NRX | 
~ ACp,#— 41 四 
注 ; 站 (3.1) 中 ， 取 8 一 (9 ,9 )， 却 它 是 全 体 自 变 量 
# 所 对 应 的 系数 和 矩 攻 ,如 果 粒 验 结 具 是 扣 0; 自 , 一 0 成 立 
那么 我 们 认为 自 变 量 xx，………，*， 与 央 谈 景 *% -xz 之 间 的 关 
系 不 符合 线性 模型 ,此 时 庙 尖 以 其 它 模 型 。， 
类 似 地 ,对 于 指定 的 Pp x， 阶 重 阵 B83, 亚 检 验 人 很 设 
Hi: = H+ HH,: 加 二 加 《3.67 
此 时 我 们 只 须 令 了 一 外 一 人 @xZ,， 由 于 
XX Na 2, + 2,, 3,7.) 


所 以 
了 一 有 GZ 十 全 Z 了 To 
其 中 总 一 8, 一 B#， 此 时 检验 (3.6) 就 等 价 于 检验 假设 
Hi:S, 一 0， 万 1 :应 , 所 0 | 
这 正 是 检验 假设 (3.1) 的 问题 ,因此 检验 假设 (3.6) 的 检验 统计 晤 为 
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前 一 [Bol/ 1 人] 

其 中 

Go (xX— EFI) — ZLZEIN ZI — OFZ,Y 

Gos = CK — OTN — ZAHAZ ZOL I XX — G2,Y 

注 : 上 述 证 明 中 我 们 假设 ZZ” 非 奇 异 、. 事 实 上 ， 由 于 96 和 
Qo, 与 《Z2 ”无 装 而 生 是 唯一 确定 的 ， 从 而 当 rkZ < 9 十 1 
时 也 是 正确 的 ,只 要 作 一 些小 改动 ,把 9 十 1 改 为 外 十 1 一 中 Z， 
1 改 为 一 Tk(22)， 于 是 各 一 4 一 人 一 1 

更 一 般 地 ,对 于 mx 了 阶 和 矩阵 B, rk Bm; (4 十 1)Xx: 阶 
绰 阵 D; mw X +: 阶 和 矩阵 天。 我 们 要 检验 假 退 

Hy: BOD — K, H:BODxK (3.7) 

当然 这 里 要 求 BB8D ~ KK 灾 该 是 帮 容 的 .显然 , 当 五 一 六 ,一 


人 ) 时 ，(3.7) 便 是 前 面 所 讲 的 假设 形式 ， 检 验 (3.7) 的 统计 量 订 


以 用 似 然 比方 法 求 出 ,但 较 复 杂 , 我 们 用 另 一 种 方 靶 说 明 伏 然 比 绕 
计量 ,而 且 次 观 意 义 了 明确。 由 定理 2.4 知 
中 一 X[ — ZZZONZIX ~ Wn mg— 1,3) 
6 AXEL ~ NB, TZZY 
且 日 与 人 @ 相 互 独立 ， 由 第 二 章 定理 4.1 以 及 第 三 章 定理 2.7 知 
U~— BOD ~ Na (BOD, BEB',D CZZYD) 
VV BO ~ Wn— 9—1,B83B’) (3.8) 
且 避 与 VV 相互 独立 ， 于 其 在 H, 成 立时 
BOD 一 Ko~ Nu0, BEB' DCZZE DID) 
利用 第 三 章 推 论 2.4 
WP = (BOD 一 KYDCZZY DI BGOD 一 天 了 
~ Wl BEB') (3.9) 
仍 与 斑 狸 立 。 所 以 可 取 检 验 绕 计量 
A~— VV+ WI 一 Atm,n—s— ,7) 《3.107 
当 4A4 志 4 时 , 拒绝 原 假 设 各 :38BDP 一 天 ， 其 中 P(A 二 4 一 
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zx。 从 而 答 验 (3.7) 的 步骤 如 下 : 

(1) 计算 一 XZ(Z2YT! 和 四 一 着 (一 (ZE 区 
《或 先 计算 Z*， 再 由 (2.39)、(2.40) 及 (2.44) 求 田 8*, 生 和 8) 

《2) 计算 BGD 和 VV 一 8388 

《3) 计算 WW 一 (B36D 一 KED(Z2Z TI 下] MBOD 一 KY 

《4) 计算 4 一 IF/ 十 瑟 | 

《5) 对 于 给 定 的 显著 水 平 c, 求 出 4。 使 得 PCACm,# 一 9 一 
1 之 A) 一 w 这 里 当 加,# 为 1,2 时 可 利用 第 三 章 下 3.1 查 
F 表 , 当 mm > 3, :> 3 时 ， 可 利用 第 三 章 公式 (3.6),(3.7)( 视 n 
的 大 小 ) 查 六 表 . 

C6) 根据 所 得 痢 界 值 来 判断 是 否 拒绝 风 。 

最 后 我 们 要 指出 , 在 定理 3.2 的 证 明 中 XRX 的 直观 意义 当 
时 并 不 明确 。 事 实 上 可 以 验证 , 若 取 


站 一 CO ) , 6 — (6.6,) 


则 有 
[5 
XRY = BDCZ ZTD']E: 
《 窗 作 习题 ), 因此 在 实际 运用 中 有 了 肝 可 以 直接 人 愉 8 和 意 着 手 。 
例 31 在 例 2.1 中 建立 的 线性 回归 方程 中 ， 闪 验 自 变 xz #3 
对 因 变 量 x, 和 * 有 无 显著 影响 , 再 检验 zs 对 x, 和 有 无 显著 影 
响 。 
此 时 pp 一 2,， 9 十 1 一 3,，# 一 7, 名 一 (96.6.6,) 是 2x3 阶 
矩阵 。 
检验 ET 和 和 ES 对 办 和 1 有 是否 有 显著 影响 , 即 检 驻 
HB = (O00) 一 0 Hx0 
按 定 理 3.2 的 方法 ,由 例 2.1 已 求 电 了 兰 , 即 
。 0.8286 0.7571 
加 (0757 1 8757) 


,2 他 。 


而 加 一 (和 一 而 ZX 一 四 2 了 ZE 一 [1 .13xr。 允 
GB, 一 XZICZZ 人 一 《150.44 327,79) 
本 以 
。 401.068 987.0477 、 
本 (687 0477 ,633.5641) 
根据 (3.3) 式 可 计算 得 


4 一 | 吕 11/ 立 | 一 LEXT = (0.00346): 
而 
A~ ACT 一 2 一 1,2) — AC,4,2) 
根据 第 三 章 玫 3.1 知 
F 一 2 ， 4 ~ FC4,6) 
由 4 的 值 可 计算 得 . 
3 1-wA_ 3,1 0.00346 _ 432.03 


2 AAA 2 0.003456 
对 于 给 定 a 一 0.05， 查 FF 表 得 临界 信 Fossl4,6) 一 4.53。 显 然 
432.03 > 4.53, 改 拒绝 有 (4 越 小 ， 则 (1 一 V4)/V 4 越 大 )， 
即 xs: 对 x,,x: 有 显 薯 影响 。 
检验 zi 对 ,x3 是 否 有 显著 影响 , 即 检验 
Hi:@, 一 日 :一 0 Hi:0,0 
此 时 利用 统计 量 (3.10) 更 为 方便 . 取 B= 了, D' 一 《00 1), 根 
据 (3.8) 和 (3.9) 式 可 计算 得 
5.80 30 
5.30 13.13 


W = (BODYD' (C22 YD] BODY 


7 一 808 一 025 一 2 一 人 


= 67 ， C0,0144)-1C0.42 5. 67) 
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{ 12.25 165.375 
165.375 2232.5625/ 


从 而 


48.064 


A |VI/IV + W|I = .004 C0.0649) 


再 计算 


236.978 


1 


Fao3.1—V4 一 43.225 
A 


查 卫 囊 得 FlossC2.6) = 5.14， 显然 了 >5.14， 歼 拒 弧 H。， 即 z; 对 


xx 有 显著 影响 . 


例 3.2 表 3.1 中 的 数据 是 哥 尔 非 大 学 动物 系 一 次 试验 中 取 
得 的 .在 25 桶 鲜 鱼 保存 液 中 泥 有 不 同 剂 旱 的 铜 z; (每 立 刘 毫克 )， 
并 记录 下 每 尹 鱼 的 平均 重量 zy (fj 呈 1,2，，…，25)， 也 记录 下 在 
B,14, 24, 36, 48 小 时 后 死亡 的 色 的 比例 数 ， 为 了 欧 定 变革 ， 特性 


《 比 钢 ) 变量 p: 将 


由 友 正 迟 函 数 变 换 成 为 x 一 arcsinp (i= 


1,*…*5), 回归 模型 为 


Kyxss 一 yx x 二 生 


利用 计算 机 求 得 回归 系数 全 的 LS 估计 为 


一 94.601 19.275 一 24.683 
一 229.176 43.667 一 20.037 . 


太一 天 ZEZOT 一 | 一 258.803 48.990 3.332 


另外 还 求 得 《rz … 
1 0.353 一 0.124 一 0.334 一 0.322 


一 246-048 47.327 5.224 
一 232.958 45.098 . 8.239 


;Xs) 的 相关 矩阵 为 


1 0.354 ”0.309 0.322 
1 0.916 -0.889 
1 0.986 


2A5 。 


表 3.1 对 25 桶 鲜 鱼 的 试验 数据 


于 


~ 


(者 最 对 数 》| “平均 思量 》 


I EF] ts a 
上 0 30 30 30 1 号 号 各 个 0.6695 
各 18.435 | 33.211 | 33.211 | 33.211 1 #.0161 D6405 
0 45 60 71.565 | 71.S65 1 6. 4I134 0.729 
22.781 | 53.729 | 90 30 o0 1 6.8459 0.77 
4 之 .130 90 90 yo 9 1 7.2793 0.5055 
0 12.921 | 26.565 | 26.565 | 26,565 1 5 S984 0.782 
[2.921 | 18.434 | 33,211 | 33,211 | 33.21} 1 6.D161 b.812 
12.921 | 4 拉 .23 1 77.079 | 90 | 90 G4[35 0.8125 
18-435 | 56.989 | 930 9 | 90 1 #.8459 0.869 
26.565 | 87.214 | 30 EE | 30 1 7.2793 0.8395 
站 0 0 ]2.921 1 .S954 0.8615 
站 12.921 | 22.786 | 30 33.211 1 65.0161 .9045 
0 22.786 | 77.079 | 77.079 | 77.079 上 6 .4135 1-.028 
0 47.869 | 77.079 | 90 90 1 6.8459 1.0445 
18.435 | 他,213 | 30 90 90 i 了 .2793 1.0455 
0 0 0 12.924 | 18.435 1 5 .5984 D0.6195 
0 12.921 | 23.796 | 3 和 .5563 | 3 1 5:0161 D0.3305 
18.435 | 42.130 | 77.079 | 77-079 | 77.078 1 6.4135 D.597 
1B.435 | 56.789 | 90 30 90 1 459 0.6385 
36.271 | 77.079 | .90 y0 90 1 了 .2793 0.6645 
必 12.921 | 26.555 | 26.565 | 26.565 1 号 。598 学 D5685 
局 个 22.786 | 30 30 1 6.0162 0 .604 
0 | 39.231 | 71.565 | 90 oo 1 6 135 D0.6325 
12.921 | 53.729 | 90 30 0 1 .8459 站 .6845 
33.211 | 67 .213 | 90 90 30 1 7.2793 D.72% 


从 自 与 R 可 以 观察 到 x,, xz, #5 之 疗 存 在 着 高 度 相 关 且 回归 系数 
很 接近 的 .. 这 是 由 于 鱼 对 有 毒物 质 的 适应 性 ， 但 我 们 感 兴趣 的 是 
柄 中 僵 的 下 均 重 量 是 否 对 死亡 速度 有 影响 。 即 要 考察 sa (平均 年 
量 ) 对 因 变 量 #0i 一 15， 不 同 的 i 对 应 着 不 同 的 死亡 了 时间》 
是 否 有 显著 影响 。 对 于 回归 系数 些 阵 @ 一 (B6.6)， 我 们 要 检 
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全- 一直- 


验 
H,: BOD mb H,: BAD :x 0 
其 中 B 一 J ,D001), 此 时 mm 一 5,， fr 一 1,， 9 十 1 一 3， 
# 一 25。 类 位 于 上 例 计 算得 到 
站 了 于 且 [一 066 CA~ AC5,22,1)) 


因而 


I8 。1 一 从 
Fo 一 1.90 F ~ FCS5,18 
C 《5， 7) 


对 于 显著 水 平 « 一 0.05 和 自由 度 (5,18) 查 了 表 得 FoyC5,18) 一 
2.77, 显然 下 一 1.90 之 2.77。 因 此 可 以 接受 H,。 即 鱼 的 平均 置 
量 对 死亡 速度 没 在 显 著 影 响 ， 
《二 ) 亲 元 回归 的 预测 问题 
在 多 对 多 回归 模型 (1.12) 中 , 设 了 ~ NB2Z ,5,1,)， 并 且 
建立 了 回归 方程 


x— Bz (3.11) 
现任 给 自 变量 以 值 za, 要 预测 相应 的 x。, 剧 然 , 由 回归 方程 (3.11) 
可 得 预测 值 向 量 名 一 Bw， 下 面 我 们 要 考 赔 @zy 的 1 一 8 置信 
区 域 及 x 的 预测 区 域 两 个 问题 . 

C1 Bz 的 1 一 a 置信 区 域 

由 定理 2.4 知 

Ge~ Nan(B, B22 OO, Or~ Wln— G1,3) 
且 租 互 独立 。 所 以 : 

Gz 一 KZZLN 0 ~ NO ZHZL') ts0 + FY 

且 与 8 相互 独立 。 于 是 由 Hotelling-T? 统计 其 的 定义 知道 


天 一 (222) "2) a6 — 0 (FL) (0— 8) 


~ Pn 9 1) Flpsn— go— py 


和 一 4 一 
记 而 给 定 显 著 水 平 4 后 有 
。247 。 


P {rT 4 Dr, ps —g— pl le 


4 
页 8 的 1 一 a 置信 椭 球 为 
本 3 一] p 
《他 zu B10) Oa 一 820) < ng 
* ZAZZ) a0 PAApsn— 9 — Pp) (3.12) 


根 沁 第 五 章 {2.5) 式 ， 对 于 Bz 的 各 个 分 重 , 即 对 Bera(〈i 一 
1,2,-…; 记 )， 它 们 的 1 一 & 同时 置信 区 间 为 
1s, -一 人 oz | . 


p | 
< | 一 PCp,n —9 一 P) ZKCZE DZ095 
(3.13) 
其 中 YY， 分 别 为 站 和 名 的 第 站 行 向 量 , 8;; 是 人 的 (元 
素 . 
《2 2 的 预测 区 域 
中 第 二 节 关 于 预 洲 问题 的 讨论 知 ,在 正 态 假设 下 ,误差 
Xo ~ zo ~ NLO, Cl ZZ2) 1z)2] 
类 似 地 有 为 的 1 一 a 预测 区 域 是 三 球 
(xo 一 zz) 0 (x 一 zo) 所 C1 十 EA 
p 


“人 (3.14) 
而 x 的 分 量 的 同时 预测 区 间 为 
Fx 一 Bor, 
< r,s oe Fatp,#—p— a)* (14 EZZ Y 1g0) gn 
(C3.15) 


比较 (3.12) 与 (3.14),(3.13) 与 (3.15), 显 然后 者 稍 宽 一 些 ， 它 反映 
了 随机 误差 ea 的 影响 . 
例 3.3 ”利用 例 3.1 建立 的 回 轨 方 程 来 求 出 当 有 一 《1, 130， 
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7.57 时 由 应 的 预测 值 如， 并 给 出 显著 水 平 wa 一 0.05 时 @z 的 
1 一 & 置信 本 图 和 x 的 1 一 a 预测 椭圆 。 
由 回归 方程 
有 一 8.42 十 1.08g， 十 0.425, 
一 14.42 十 2.25s, 十 5.67zi 


将 下 一 《130,7.5)》 代 人 得 预测 值 为 


过 _ 151.97 

名 一 人 ) 一 “一 Go ) 
这 里 * 一 7， pc 一 2,，9 汗 1 一 3。 由 (3.127) 知 8z 的 0.95 置信 入 
圆 为 


5.80. 5.30% 7 
Cp — 151.97, pi— 349.45)( ) 


5.30 13.13 
— 151.97 
x( 一 349.45 ) < 地 93 
其 中 Cpy pyY 一 (O50.0%5), 0.347 ~ SHAZ ZY) FE 9.55— 
sz 3). 
对 于 x 一 (zw xw) ”的 0 好 预测 区 坊 只 须 用 

1 十 ZZZ'Y iz 一 1.347 
代替 上 式 中 的 zi(ZZ zo 一 0.347 风 可 得 显然 ，B%。 的 0.95 
置信 椭圆 与 x, 的 0.95 预测 杭 圆 其 中 心 相 同 ,但 后 者 较 大 。 


*§ 6.4 变量 的 筛选 

在 进行 回归 分 析 时 ， 如 果 把 某 个 对 因 变 量 有 显著 影响 的 自 变 
量 过 漏 掉 , 回 归 分 析 的 效果 是 不 会 好 的 ,于 是 人 们 尽 可 能 多 的 网 择 
自 变量 。 特 别 是 在 对 研究 的 现象 尚 不 清晰 时 往往 会 考虑 许多 自 变 
明 ， 如 在 气象 学 中 考 塌 的 自 变量 可 能 会 超过 100 个 。 这 样 常 党 把 
对 四 变量 没有 户 堵 影响 的 自 变量 列 人 了 回归 方程 ,实践 证 明 ,其 回 
归 效 果 不 因 为 这 些 自 变量 的 增加 而 变 得 更 好 ， 术 反 会 带 来 许多 麻 
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烦 。 因 此 在 回归 分 析 趾 自 变 匣 的 选择 是 一 个 十 分 重要 的 河 题 ， 在 
本 节 里 我 们 将 介绍 两 种 常用 的 变量 锯 选 方法 ， 即 逐步 回归 方法 和 
双重 乌 迄 的 逐步 回归 方法 ， 恨 据 所 介绍 的 计 径 步 很 容易 编 抽 相 
应 的 程序 。 

(一 》 逐步 回归 方法 

1. 逐步 回归 的 基本 思想 

在 建立 回归 方程 时 ， 我 们 总 是 希望 得 到 的 回归 方程 中 包含 了 
对 因 变 量 有 显著 影响 的 自 变 量 ， 而 不 包含 对 因 变 量 没 有 显著 影响 
的 自 变 量 、 不 妨 称 这 种 回归 方程 为 “最 佳 ”回归 方程 ， 建立 最 佳 " 回 
归 方 程 我 们 自然 会 租 到 用 下 列 两 种 方 兴 : - 

《1) 设 可 殿 选 择 的 自 变 量 有 8 个 : xz，…，zv， 按 $6.2 的 方 
法 先 建立 全 有 3 个 自 变量 的 回归 方程 ,再 按 $6.3 的 方法 对 各 个 自 
变量 进行 显著 性 检验 ， 把 不 重要 的 自 变量 剔除 。 例 如 第 一 次 剔除 
一 个 自 变 量 保留 ? 一 1 个 自 变 量 ， 从 新 建立 含有 4 一 1 个 自 变 量 
的 回 妇 方程 《注意 原来 的 画 归 方程 是 在 4 个 自 变量 的 情况 下 计算 
的 , 对 于 4 一 1 个 自 变 量 的 回归 方程 的 回 妇 系数 必须 重新 计算 )， 
然后 对 含 在 4 一 下 个 自 变 量 的 加 归 方程 又 进行 检验 ， 把 作用 永 显 
著 的 那 一 个 再 剔 只 ,再 重新 建立 4 一 2 个 自 变 量 的 回归 方程 …… ， 
终于 有 一 个 阶 和 用 没有 再 可 以 剔除 的 自 谈 量 了 ， 这 时 便 可 得 到 最 后 
的 回归 方程 ， 

C2) 和 鞠 在 8 个 自 变量 中 选取 一 个 对 因 变 量 最 有 影响 的 自 变量 
zi 建立 回归 方程 , 然后 再 从 余下 的 9 一 1 个 自 变量 中 选取 田 一 个 
自 变 量 xz;, 使 得 包含 《zi;，si,》 的 回归 方程 效果 最 好 ， 依 次 类 推 ， 
直至 和 个 自 变量 都 被 选 人 ,这 样 得 到 了 了 个 回归 方程 ,然后 按 某 种 
准则 比较 这 9? 个 男 归 方程 ,从 中 选择 一 个 最 好 的 ， 

上 述 两 种 方法 都 月 仍 点 , 首先 是 计算 量 非 常 大 ,另外 ， 如 果 一 - 
个 目 变 量 被 副 除 后 , 它 就 永远 被 排斥 在 回 妇 方程 外 ,如果 一 个 自 变 
量 被 选 人 它 就 永远 留 在 回归 方程 中 ， 这 样 往往 会 产生 不 合理 的 结 
困 。 这 是 因为 自 变 证 之 间 也 存在 着 某 些 制 约 关系 、 因 此 每 个 自 变 
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僵 对 因 恋 景 的 影响 的 显著 注 不 但 与 它 自身 有 关 ， 而 且 还 与 同 它 一 
起 进入 回 准 方 积 的 其 它 自 变量 有 关 , 例 如 某 个 原先 影响 显著 ,但 
后 来 回归 方程 中 的 自 变 党 发 生变 化 率 制 了 zi 的 影响 , 而 使 它 变 得 
不 显著 了 (当然 象 这 样 的 自 变 量 还 是 得 剔除 ), 直 反 地 ,若菜 个 自 变 
基 zx 原先 影响 不 显著 ， 后 来 回归 方程 的 自 变量 变化 了 , zi 又 变 得 
显著 了 ( 象 这 样 的 自 变 量 还 得 重新 选 入 方程 ”由 上 所 述 ， 在 建立 
“最 佳 ”6| 归 方程 的 过 程 中 通常 有 大 量 的 自 谈 原 进 进 坝 出 ，-- 直 到 
该 进 的 进 完 了 ， 该 出 的 出 完了 为 止 。 于 是 便 产生 了 逐步 同 归 的 想 
法 。 

所 谓 逐 步 回归 方法 是 指 一 种 建立 “最 侍 ” 回 芭 方 程 的 计算 方 
法 , 它 在 计算 的 过 程 中 同时 考 虞 到 自 变 量 的 选 入 和 剔除 ,能 以 较 少 
的 计算 量 建 立 起 “最 佳 "回归 方程 .此 方法 是 从 一 个 自 变量 开始 ,把 
自 变 最 逐个 选 人 ,每 一 步 只 选 一 个 自 变 量 , 并 且 要 求 当 步 选 人 的 自 
变量 是 所 有 未 被 选 人 的 自 变 量 中 最 显 车 的 一 个 ， 在 选 人 自 变 量 的 
同时 还 可 以 判断 已 在 回 妇 方程 中 的 自 变量 基 否 还 显 落 ，、 若 仍然 显 
著 ; 就 让 它 继续 保留 在 同 归 方 程 中 , 若 变 得 不 民 著 ,那么 立刻 别 除 . 
这 样 反 复 进行 直到 自 变 量 虐 不 能 被 选 入 又 不 能 被 吻 除 为 止 ， 并 立 
即 能 建立 起 相应 的 “最 佳 "回归 方程 。 

2. 先入 和 央 除 自 变 量 的 检验 : 

一 般 地 ， 我 们 只 须 对 某 一 步 给 出 选 人 自 变 量 与 剔除 自 变 量 的 
方法 ， 就 可 以 得 到 一 般 的 方法 。 在 这 一 小 段 中 我 们 先 介 绍 选 人 和 
剔除 白 变 量 的 依据 . | . 

假定 在 某 一 步 已 有 ? 个 让 变 量 x,, ,x 人选， 待考 察 是 于 
能 入选 的 自 变量 是 zx,+,,-……,zs。 相 应 的 资料 阵 记 为 


和 
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如 果 只 考虑 2,,……,z, 对 aa, -zy 的 回归 方程 ,就 有 


1 

r — C08) (> )+e ca) 
E~ N.C0, 5 ,1.) 

注意 到 (4.1) 中 8 为 对 应 于 自 变量 z， … ,x 的 回归 系数 从 阵 , 而 

之 是 它们 相应 的 资料 印 阵 ， 


逐个 著 察 添加 zw-+ ys 就 相当 于 把 它们 所 对 应 的 资料 - 


zt 在 (4.1) 式 的 右 端 ,例如 考察 zt+4 旅人 后 的 
模型 ,此 时 就 成 为 


二 
fr — (89 oa 2 机 6 (4.2) 


Ei 
ee~ Npst0s Si,) | 
显 热 ， 要 间 添 加 zxt9 后 对 回归 方程 是 否 有 显著 影响 ， 就 得 窒 验 
(4.2) 中 的 旭 4 是 否 等 于 0, 即 检 验 日,: 人 .3 一 0 是 否 成 立 。 根据 
本 章 定理 3.2, 检验 统计 最 为 - 
A iOn{ ii) ~ ACp,n mr — 2,1) (4.3) 
其 中 +， 和 8, 分别 为 对 应 于 (4-2) 和 (4.1) 的 回归 方程 的 残 差 交 
又 乘 积 矩 阵 ,再 根据 第 三 章 表 3.1 知 
Fm ?1,1 A 
人 Fp A 
这 样 检验 几 : 4, 一 0 就 化 成 了 检验 。 对 于 给 定 的 显著 水 平 
ai 由 自由 度 (#8, mn 一 r 一 ?一 1) 查 F 表 得 稿 界 值 F.Cp,# 一 
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~ Pipa—r—p—1) 


rf 一 也 一 1), 若 Fr 小 于 临界 值 , 则 认为 mt 对 因 变 量 没 有 最 
著 影 响 , 否则 有 显著 影响 ， 

类 伺 地 ， 对 gz,…… ,ze 中 任 一 个 局 选 人 它 以 后 是 委 有 显 蒋 
影响 的 检验 统计 量 为 


Fi= 一 1 ~ Flpn—r—p—1) (44) 
4 


对 于 一 rf 十 1,7 十 2,-…",9 计算 出 其 R 值 : Ri Fmy 
F,。 从 中 找 嘲 量 天 的 一 个 ,例如 F, 最 大 ,如果 
FF tAp nr—p— 1) (4.5) 
则 z, 不 必 引 进 。 由 于 ,是 最 大 的 一 个 ， 故 其 它 自 变量 都 没 有 引 
进 的 必要 。 若 (4.5) 不 成 立 , 则 要 引信 ”， 此 时 将 (4.1) 式 中 过 扩充 
一 行 z*Y。 再 逐个 考察 余下 的 4 一? 一 1 个 自 变 量 是 否 有 可 选 
大 的 ,这 一 过 程 和 刚才 完全 类 羽 。 
现在 来 讨论 昂 除 自 变 量 的 检验 。 没 已 人 选 的 自 变 量 有 ” 个 : 
2 22g ar 完 金 类 似 于 引入 情况 的 讨论 可 得 到 已 在 回归 方程 
中 的 第 个 自 变 量 的 显著 性 检验 绕 计 量 为 


一 一 请 .一 而 
;= Ld 5 a A i~ Flp,n—r—p) C4.6) 


fm ld 


其 中 
= |/12 | ~ ACtp sn— ro 1,1) 

而 8, 与 员 -， 分 别 为 回归 方程 中 有 自 变量 x; 和 没有 zj 的 残 差 交 
马 乘 积 矩 阵 。 

对 于 了 一 1 2 -rr 计算 出 其 P 什 : 多,,-…, 名 ,。 对 于 给 
定 的 显著 水 平 a, 根据 自由 度 (p,n 一 一 查 F 表 得 临界 全 
Felpsn 一 ?一 让， 在 久 ,，…, 守 。 中 找 出 最 小 的 一 个 , 和 例 如 久 , 
最 小 ,如 县 


E> Fpn—r— py) (C4.7) 
则 表明 z, 对 因 变 量 有 显著 影响 不 应 崭 除 . 由 于 久 是 最 小 的 一 个 ， 
* 233.«* 


当然 其 它 自 变 重 就 更 显著 了 , 闫 (4.7? 不 成 立 ， 则 应 将 #, 从 回归 方 
程 中 剔除 。 虽 除 后 再 重复 刚才 的 讨论 ,看 看 是 否 还 有 可 遇 除 的 ,如 
果 没 有 副 除 的 ， 则 再 转 人 “是 否 可 引 人 新 自 变量 "前 讨论 。 这 样 反 
复 香 行 直到 出 现 寻 不 能 引 人 和 人 又 不 能 删除 时 逐步 加 她 终 正 。 
注意 到 上 述 “ 引 人 ” 自 变 量 的 检验 中 , =; 还 末 被 引入 之 前 统计 
量 (4.4) Fi 中 的 4 事先 是 末 知 的 , 即 (4.3) 式 中 的 2 ， 是 无 法 算 
出 的 ， 因 此 我 们 希望 以 已 含有 7 个 自 变量 的 珈 归 方 程 的 残 差 交叉 
乘 台 矩阵 2， 导出 8， 关于 它 的 推导 可 参看 19]。 在 具体 实施 
时 ,它们 之 癌 的 关系 是 通过 一 种 紧 凌 的 年 阵 变 的 来 实现 (后 面 将 要 
介绍 )。 此 外 还 要 注意 到 在 “ 引 人 和 人 "与 “ 噜 除 " 的 各 步 中 痢 是 用 三 答 
验 , 但 其 临界 值 是 与 已 在 方程 中 的 自 变 量 个 数 * 有 关 , 即 每 进行 一 
步 痢 界 值 都 发 生 恋 化 。 但 当 一 r 一 了 较 大 时 ，F,.,(p,# 一 7 一 
p 一 1) 与 P,P,5 一 ?一 户 ) 相差 不 大 ,其 中 参数 7 为 已 在 回归 
方程 中 的 自 变量 个 数 , 为 了 方便 编制 程序 ,根据 经 验 往 往 把 ? 固定 


的 取 为 分 的 整数 信 ， 这 样 无 论 是 “ 引 人 ” 或 者 * 遇 除 ” ,无 论 在 那 一 
步 都 采用 同一 个 检验 列 界 值 
+ 加 
Fr PP (e， p 人 ) G48) 


3, 逐步 辣 妇 所 用 的 紧 凌 变换 共 

逐步 回 阿 总 基 在 对 回归 方程 中 所 含 自 变 最 的 基础 上 考虑 引信 
新 的 自 变 量 或 剔除 自 变 量 , 无 论 是 引入 或 则 除 都 希望 在 施行 后 能 
很 快 地 判断 出 下 一 步 的 动向 、 并 卫 在 逐步 回归 结束 后 能 立刻 写 岂 
最 后 的 回归 方程 。 下 面 介绍 的 紧 姜 变换 东 就 能 够 做 到 这 些 要 求 。 

设 已 取得 8 维 自 变量 和 P 维 因 变 最 的 数据 矩阵 ， 且 已 经 中 心 
化 了 (当然 也 可 以 考 乱 标准 化 数据 , 此 时 后 面 的 (4.11i) 式 便 是 相关 
系数 惩 阵 ? ,把 它们 记 为 

Zo (2 ) 一 (zz (4.9) 


BT 和 
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Ry “ “性 | | 
x } -cx C4.10) 


这 和 光 划 2 ““ 攻 记 用 


把 Z 和 多 合成 一 个 《g 十 PD Xs 阶 的 资料 矩 降 


"一 (zx 


并 计算 了 矩阵 的 交叉 汇 积 撼 阵 
， pr Lzz Lzx 
工 -UU -(x) Xx) 一 人 
[ 交 a fig ‘hety Tr tgtp) 


a 


上 ee ete C4.11) 


i 


togtey “** datpe Pe “degtpygtpl 
其 中 Lzz 一 22’, Lxr 一 XX', Lzx =— ZX = 《ZY 四 Liss 
它们 是 Z 和 和 闫 的 各 种 人 交叉 冬 积 矩阵 ( 若 数 据 都 是 标准 化 了 ; 则 工 便 
是 z,，… ,ze，x,，*- xp 的 相关 系数 矩阵 )， 

紧 启 变换 落 就 是 通过 柴 阵 (4.11) 来 完成 ,好 每 一 步 , 不 论 是 引 
人 或 昌 除 一 个 自 变 重 , 都 必须 对 (4.117 作 一 次 竺 阵 变换 ， 为 了 标明 
变换 的 步 数 ,我 们 将 (4.11) 记 为 

了 各 Prprigtsy (一 12 0992 十 1 4+ 
并 用 
《rt 12 “+ p) 
表示 对 应 于 第 各 步 变 换 后 的 相应 矩阵 ， 第 加 十 1 步 是 在 第 加 步 的 
基础 上 3 引信 或 副 除 自 变量 x, 市 得 来 的 《如 果 说 第 加 十 1 步 是 列队 
变量 z, 那么 说 明 在 第 六 步 以 前 回归 方程 志 引 人 了 xz.; 邵 果 说 第 
za 十 1 步 是 引入 自 变量 x， 那么 说 明 直 到 第 中 步 a% 还 在 回归 方程 
之 外 ). 紧 次 变换 是 指 L**? 的 元 素 蚊 ' 由 工 * 的 元 素 村) 按 
以 下 的 变换 公式 而 确定 ; 
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- 当 一 了 一 时 (rr 行列 的 交 允 元 素 ) 


1 


I 一 —i fir 当 于 sr Fw 和 rr 时 (r 询 的 元 素 》 
Hp/ ee 当 了 一 sr 时 (Cr 行 的 元 素 ) 
一 /lm 当 is rj er 时 (其 它 行 与 列 

的 元 豪 》) 
【4.123 


对 矩阵 Lm 按 (4.12) 进行 变换 ， 称 它 为 对 工 (”， 进行 > 消去 变 
换 , 这 个 变 钦 公 式 来 源 于 解 线性 方程 组 的 矩阵 变换 法 。 若 记 

下 全 oo Ce led) Lt ~ Cb, pe) 
区 矩阵 变换 公式 (4.12) 有 下 面 的 性 质 : 

(i) 如 果 和 是 人 选 变 量 , 则 L919 一 一 上 9+， 

(ii) 如 果 z; 是 未 人 选 变量 , 则 也 gta 一 也 好 和 

Gii》 工区:? 是 对 应 于 本 十 1 步 时 的 回归 方程 的 残 差 交叉 冬 
积 和 矩阵 , 落 x; 是 入 选 的 自 变量 。Z88tu 是 相应 于 x; 的 回归 系数 。 

(iv) zm 十 1 步 短 阵 Eee+5 内 与 mw 十 1 步 自 变量 的 金 体 有 
关 ， 而 与 引入 mm 十 1 步 自 变 量 的 先后 顺序 及 曾经 引信 而 后 又 被 唱 
除 的 自 变 量 无 关 ， 例如， 到 了 第 mw 十 1 步 已 引 人 了 大 个 自 变量 : 
zns"……szit《 称 它们 为 吉 十 1 步 自 变量 的 全 体 ), 那 么 Lm*? 只 与 
这 些 自 变 量 的 全 体 有 关 , 而 与 它们 引 人 的 先后 顺序 无 关 。 

(v)》 变换 (4.12? 对 同一 自 变量 接连 施行 两 次 注 去 变 欣 ， 垂 阵 
元 素 椒 变 ， 即 Limtl = Le 

由 性 质 (iv) 和 (Y) 可 知 , 第 _ 十 1 步 无 论 是 引 人 或 者 剔除 
自 变量 ww, 都 要 对 前 一 步 矩 距 L(9 按 (C4.12) 式 进行 7 消去 变换 . 
当 引入 时 ,表明 第 严 步 时 x 不 在 回归 方程 中 ; 当 崭 除 时 , 表明 第 * 
时 = 已 在 回归 方程 中 。 

根据 以 上 的 竹 质 ， 经 过 一 些 推算 还 可 以 得 到 如 下 两 个 结果 : 

Ci》 如 果 在 第 mw 步 已 引 人 了 7 个 自 变量 之 后 。 要 在 下 一 步 继 
续 引 入 自 变 量 的 答 验 统计 量 (4.4) 可 写成 

"2360+ 


Fimtl 一 ## 一 冲 一 了 一 上 了 
PC 
其 中 i 鸭 未 进入 回归 方程 的 自 变量 足 码 ， 
(ij》 如 果 在 第 m 步 已 有 了 ?个 自 变量 , 下 一 步 枫 别 除 自 变 量 
的 检验 绕 计 量 (4.6) 可 写成 
tn 一 一 (一 由 一 了 ) LetL nN 
P i 
其 中 了 为 进 人 回归 方程 的 由 变量 足 码 。 
4. 逐步 回归 具体 计算 步骤 
谁 备 工 作 : 
出 中 心 化 数 握 扎 阵 64.99 《4.10) 按 有 照 (4.117 计 算 
工 吕 ”工人 训 
LD 一 (Cs jw) -= CP +p x tatp) 
并 记 LY 一 Co 的 4p))， 对 于 给 定 的 显著 水 平 x, 和 根据 
《4.87) 式 确定 “引信 人 ”和 “日 除 " 自 变 量 的 检验 临 春 值 


一 一 全 
BE 一 Fo(pn 一 2 一代) 
第 一 步 : 引进 第 一 个 自 变 量 。 
按 (4.13) 式 对 所 有 的 自 变量 zi 一 1,2，-…,4) 计算 


np LYLELY 
下 


找 出 一 个 最 大 的 RPR 值 来 ,着 一 i 时 FD 最 大 , 即 


FD 一 max FH 
i 


-〔4.133 


(4.14) 


然后 将 FP 与 fF* 比较 , 当 FP 志 F* 时 ,停止 饰 选 ， 转 人 结束 ， 
这 种 情况 的 出 现 说 明 自 变量 与 因 变 景 之 间 不 存在 线性 关系; 当 
Fh > F* 时 ， 引 人 #， 所谓 引入 zi, 就 是 按 公式 (4.12) 对 矩阵 
5 进行 5 消去 变换 ,并 记 成 

Lo Len (4.15) 


"R57. 


i . .一 一 


第 二 步 : 逐步 引 人 变 量 。 

假定 已 经 人 选 了 -个 变量 zi …，2is， 设 这 时 矩阵 工作 
已 变 成 了 4%， 还 有 没有 本 人 和 远 的 自 谈 量 呢 ? 对 未 人 远 的 当 变 量 
zft zi 由 上 接 (4.13) 式 计算 己 值 : Pw?? 人 Cs 和 
;4)， 从 中 选 出 最 大 的 Fi 9 来 ; 若 Ri 最 大 ,再 将 它 与 F* 比 
较 : . . 

车 Fr? ss F*， 则 停止 3 引 人 人 转 入 第 三 步 ， 

若 PF? > F*， 则 继续 引入 变量 x+， 即 按 (4.127 对 Li™? 


作 二 ， 消 去 变换 二 em See Fei9， 由 Lm+t9 出 发 重复 第 二 步 。 


第 三 步 ， 逐步 别 除 变量 

假定 已 人 选 了 r 十 1 个 自 变 是 mm， …,sr， 设 这 时 工 中 已 
变 成 ZLo， 考 虑 有 没有 需要 剔除 的 自 变 量 ， 对 人 选 的 自 变 最 
zi 按 (4.14) 式 计算 秆 :DC 二 各， 
二) ， 从 中 选 出 一 个 最 小 的 , 若 Br 最 小 ,将 它 与 P* 比较 : 

若 Fl > 了 rz， 表明 不 须 村 删除 zw,, 转 入 第 二 步 。 

车 各 +2 < By+。 表明 要 副 除 zi,, 此 肝 对 LI 按 (4.12) 式 进 


行 i。 消去 变换 上 "Le+1 然后 重复 第 三 步 


| 这 样 反复 进行 ,直到 出 现 既 不 能 引入 叉 不 能 田 除 时 ,逐步 回归 
停止， 
计算 最 后 结果 : 
撑 步 回 妇 结 束 后 ,必须 写 出 最 后 得 到 的 “ 景 佳 " 回 归 方 程 , 设 最 
后 选 人 了 和 个 自 变 量 za zs 这 时 5 已 变 成 工人; 
A 
根据 官 阵 变 换 公 式 (4.12) 的 性 质 〈iii) 立刻 便 可 写 出 "最 佳 " 回归 
方程 为 
和 一 克 十 {toei, 一 到 十 lg es, 一 于 
一 古人 


和 


a) 
mC4.15’) 
“他 一 ER 十 人 一 Fi) 十 ，… 十 et | 
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i 1 之 , - _ sa 
其 中 一 Si 为 自 变 好 


各 的 ”个 观察 值 的 平均 ， 

为 了 进行 预测 误 答 的 分 析 。 需 本 计 算出 * 最 佳 " 回 归 方 程 的 残 
差 交叉 小 积 矩 隆 8，, 仍然 由 性 质 (iii》 便 可 得 

0 一 工 恕 {4.16) 

注 “ 当 资料 矩阵 中 的 数据 已 是 标准 化 数据 ， 即 LY 为 相关 矩 
泗 ， 那 么 最后 的 回归 方程 中 各 个 变量 都 是 标准 化 变 最 。 为 了 应 用 
方便 必须 将 它们 还 原 为 原 变 量 ( 参 看 例 4.1). 

我 们 就 因 变 量 的 数目 p 二 1 的 情况 , 举 一 个 非常 著名 的 例子 ， 
这 个 合子 曾 被 许多 书 铸 和 文献 引用 。 注 意 到 当 2 一 工时 (4.13) 和 
《4.14) 中 的 工 ,; ,xx ,上 上 st 都 变 成 了 一 个 数 . 

例 4.1 某 种 水 泥 泌 固 时 放出 的 热 全 x*C- 卡 / 克 ) 与 下 列 四 种 化 


甫 4.1 水 泥 试 验 数 据 


成 从 有关: 一 3CaD * AlOs C%), 5 一 3Ca0 "Si0， (%), 
一 4CaD ， ALOs "FeO %) 2 2CaO * SiO( 和 )]。 其 试验 数 
襄 见 表 4.1 试用 逐步 回归 方法 建立 团 归 方程 《ce 一 0.1)。 
准备 工作 : 
将 表 4.1 的 数据 进行 标准 化 处 理 。 由 标准 化 数据 计算 出 LY 
《此 时 的 LW 就 是 aysyssisfsz 的 相关 系数 托 阵 7): 


和 DZ28573 -一 0。8B2413# “一 及 ,2Z45445 .730717 

.228579 1 —0.139242 —0.972955 0.816253 

LD 024134 一 .139242 1 0 0233 —0 ,934671 

-0.245445 一 -人 -972955 0O.029537 1 0.821305 
O730717 0-8146253 —O0.334671 —0.821305 1 


根据 所 给 的 gc 一 01, nn 一 13, PP 一 1， 9 一 4， 按 (4.8) 式 查 F 表 
给 出 "引入 "和 “剔除 ” 自 变 量 的 临界 值 汶 
F* em FP,oll,10) = 3.29 
第 一 步 ; 选 泽 一 个 变量 进入 回 归 方 程 . 利用 LY 及 C4.13) 式 
计算 得 

| _ . Pe 工 熏 um 
PP 一 43 一 2 二 er 
0.730717 X 0.730717 
1 一 0.730717 X 0.730717 


号 1.145620 


-ll1lx 


向 再 可 得 
FD 21.960678, FD = 4.403423, FD 一 22.7986 
显然 Fb 最 大 , 且 FP 之 F* 一 3.29, 政 选 x, 进入 回归 方程 . 即 
对 LS 按 (4.12) 式 进行 二 一 4 的 消去 变换 得 
.933757 —0.010224 -路 .881588 于 。 品 .245445 四 5233 了 2 
00228 站 0333 一 .110504 0.972955 让 了 17160 
Lo| 816884 O01I0504 0.999128 —0.029537 ~0.510#12 


245445 .723 1 —0.321305 
0.529[3Z O760 一 05i04I2 .821305 0.325454 
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第 二 步 ， 继 续 逐 个 地 引 人 自 变量 ， 
(1) 利用 La， 按 (4.13) 式 计算 未 进 人 回归 方程 的 外 变量 
宫 | 让 35 记 了 的 所 值 : 
2 
FP 3D CR 


一 10x 0.297930 一 108.22 


0.325459 -0.297930 


FD = 0.172502, Fi? = 40.294854 
显然 P?? 最 大 , 且 PF 外 之 F*， 攻 引 入 有， 即 对 号 按 (4.12) 进 
行 5 一 1 的 消去 变换 得 
1.064103 —0.D108B4 —0.869250 0.261179 0D.563052 
0.010884 0.053284 0.119379 0.975626 0.022919 
Ln | 0.869250 —0.119395 0.289051 0.183816 —0.050463 


O261179 —O.075626 —O.183816 1.G64105 ~—0.683107 
一 站 .563052 0.050463 —0.050463 0.683]07 -0.027529 


C2) 继续 引 人 自 变量 ,利用 L333， 按 (4.13) 计 算 未 进入 回归 


方程 的 自 变 量 #4,x; 的 F 值 ; 
0.009865 
0.027529 一 0.009865 


Fo=9X — 5.026324 


0.008810 
.027529 一 0.008810 
显然 F 名 最 大 , 且 R > PF*， 歼 再 引入 #2， 即 对 LL 按 (4.12) 
进行 ;3 一 2 的 消去 变换 得 | 

1.66330 O20439) — 0.893654 0.460589 四 .57737 
0.204391 18 .780350 一 2.242271 28 .322562 D430415 
LIF = .893634 2.24227] 0.021336 2.371429 -0.000926 


0.460382 18.322562 —2.371430 18.94011 —O0.263182 
— 0.F67737 O0430415 和 1 


《3) 继续 引 人 自 变量 ， 利 用 L3， 控 (4.13) 计 算 53 的 二 值 : 
FY = 0.000390 


Fo mm 4.235803 


* Boi + 


显然 F< 之 F*， 帮 x; 不 能 引入 。 

第 三 步 ; 逐步 别 除 自 变 妈 ， 

二 第 二 步 知 道 已 [入 了 三 个 自 变 量 swss， 由 于 回归 方程 
中 的 自 变量 遂 个 增加 ， 那 么 太 来 引进 的 自 灾 拨 是 咨 还 显著 ? 在 这 
一 步 中 要 考虑 删除 。 

C1) 利用 工 ” 及 (4.14) 趟 计算 在 回归 方程 中 的 目 变 量 的 上 信 ， 

Bi 一 一 (013 一 3 一 1) .年 作 全) 一 型 TI} 一 1.863301 
多 


Cy 《3 一 站 了 有) 
Fa 一 一 (13 一 3 一 13。 G 和 i 一 98.7356394 
11 
[3 《3 一 上 上 我 3 
a a —(C13 一 3—1)* Be = S026024 
22 “ 


显然 了 1 最 小 ,， 且 BF 一 Pr， 故 要 副 除 a%， 即 对 LS 按 (4.12) 
进行 i 一 4 的 消去 变换 得 
1.0$5129 一 0.24i181 ~—0.835985 --0.024318 0.574137 
一 0.241181 ”1.055129 0.051847 一 0.969396 0.685017 
Le 一 | 10.835985 —0.05i847 0.318256 —0.125207 ©.033878 
O024318 。 0-967396 0.125207 0-9532798 ~ 0.013896 
一 0.574137 一 0.685017 。 0.033878 —0.013896 0.021322 


(2) 继续 噜 除 自 变量 ， 利 用 LL” 及 (4.14) 计 算 sy sm 的 了 
值 : 
in ce 146.520， FD oe 208.578 
显然 最 小 者 入” 都 大 于 F*， 故 不 能 再 删除 . 
第 四 步 : 在 了” 的 基础 上 重复 第 二 步 , 即 演 虑 未 进入 回归 方 
程 的 ss 是 否 还 能 引入 ， 按 (4.13) 式 计算 得 
FEY = 1.586729, FID mm 1.61279, 
它们 都 小 于 fF*, 敬 不 能 再 引入 、 到 此 为 止 已 出 现 跌 不 能 剔除 又 
不 能 引信 的 情况 ,逐步 画 归 停止 
给 出 最 后 绩 果 ; 
。262 。 


由 了 9 及 (4.15),《4.16) 式 (注意 此 例 的 p 一 1) 知道 回归 系 

数 及 相应 的 残 差 平方 和 为 
一 0574137, 部 一 9 一 0.685017， 
. O* — I = 0.021322 
由 于 本 全 的 变量 是 经 过 标准 化 ,为 了 方便 应 用 ,我 们 要 将 它 还 原 汶 

原 变量 ,为 此 记 

Sr bp Cri CO— EE) Si = > 《8 Bf 12, 

. 了 四 


于 到 了 
容易 证 明 还 原 后 的 回归 系数 8 及 残 差 平方 和 8&@ 与 标准 化 后 的 回 
归 系 数 外 及 残 差 平方 和 8* 有 如 下 关系 


3 


于 一 S 侠 《4.17) 
中 一 .Se 《4.187 
虫 表 《4.1 的 原始 数据 可 算得 
Soe 一 2715.7635 ，9， 415.2308 。.3 一 2905.6923 
所 以 
B= 5 X 0.574137 一 1.4683 
1 413.2308 
已 一 EEE X 0.685017 m 0.6623 
1905.6923 
0 = 2715.7635 X 0.021322 = 57.9055 
再 由 C2.40) 式 可 得 
B08,— 6, 52.5773 
从 而 得 到 最 后 的 回 寻 方程 为 
如 一 52.5773 十 1.46838 十 0.6623s, 《4.49 7 
其 或 差 的 标准 葡 为 1 


他 - 3 7 -= 2.406 
如 果 不 剔 除 zz， 而 按照 4 个 自 变 量 直 接 建 立 的 回 妇 方程 
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为 
TE 62.4052 十 1.5511%, 十 0.51018, 十 0.t01953 一 0.1441 84 


C4.20) 
其 残 差 平方 和 及 残 差 标准 其 为 


FB = 47.86, # = -5 - 2.446 


比较 两 个 回归 方程 的 残 差 标准 差 。 它 们 是 很 接近 的 。 这 说 明 其 回 
归 效 果 相 差不多 ， 但 逐步 回归 得 到 的 回归 方程 (4.19)》 只 有 两 个 自 
变量 ,应 用 起来 方便 多 了 。 此 外 ,我 们 对 水 泥 这 热量 与 其 化 学 成 份 
之 闻 的 关系 也 有 了 更 进一步 的 了 解 。 

*( 二 ) 双重 解 选 逐步 回归 

1. 问题 的 提出 

车 《一 》 中 所 讨论 的 逐步 回 妇 方法 已 被 实际 工作 者 广泛 地 应 
用 ,但 这 种 方法 有 一 个 明显 的 不 足 , 我 们 考察 自 变 量 nm，- -- ,sy 对 
因 变 县 x*,,-……, x*。 的 回归 时 ， 如 果 基 个 自 变量 > 对 一 个 因 变 量 
和 有 显著 影响 , 对 其 它 因 变量 x* ,wi_1Xiti，""* sxp 没有 显著 
影响 ,那么 在 逐步 回 娄 过 程 中 作 了 检验 时 ,很 可 能 不 最 著 而 最 终 裕 
询 法 掉 。 一 般 情 况 可 以 是 这 样 的 : 因 变 量 的 一 部 分 与 自 变量 的 一 
部 分 有 密切 的 关系 ,例如 ;pxp， 与 和 is 有 密切 关系 ， 
布 另 一 部 分 因 变 量 Kptit Ts ps 与 To sg 有 较 窗 切 的 
关系 ,如 此 等 等 。 要 注意 的 是 x ，… xp, 与 rr sxp, 不 
会 有 共同 的 变量 ,但 xz，-…… ,zs 与 zt so， 可 能 有 共同 的 
变量 : 因为 某 一 个 自 变 量 可 能 对 许多 不 同 的 因 变 量 甚至 全 部 因 变 
且 都 有 影响 .因此 自然 地 提出 一 个 间 题 ,能 否 有 一 种 逐步 回归 的 算 
法 ,将 因 变 量 分 组 ,并 找 出 对 每 组 因 变 量 在 影响 的 自 变量 ， 然 后 对 
各 组 因 恋 量 与 其 相应 有 影响 的 自 变 量 建 立 回归 方程 式 。 双 重 躲 选 
逐步 回归 就 是 解决 上 述 问题 的 一 种 方法 。 关 于 上 述 问题 所 对 应 的 
筑 型 的 描述 可 参看 [9], 在 这 里 仅 给 出 双重 饰 选 逐步 回归 的 计算 步 
琶 及 一 个 实例 。 
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2. 计算 步 又 

设 我 们 已 有 9 个 自 变 量 和 户 个 因 变 量 的 中 心 化 数据 《当然 也 
可 以 采用 标准 化 数据 ， 此 时 (4.11) 式 便 是 相关 和 托 阵 ) 矩阵 (4.97) 和 
《4.102，, 并 将 它们 合成 一 个 《9 十 2)》 x wm 阶 的 资料 矩阵 


Zz 
0 (x) 

准备 工作 : 
出 中 心 化 资料 第 阵 可 按 (4.11) 臣 计算 得 

ty reo 

工人 一 (Te Tm) CI) rpcetp 

我 们 需要 两 个 算 阵 工 , 与 5; 来 分 别 记录 自 变量 #,，,*… ,se 省 因 变 
最 x ,x# 的 饰 选 情况 。 以 下 注意 . 我们 是 按 合 并 资料 算 阵 忆 7 
中 自 变 量 和 因 变 量 的 顺序 进行 统一 编号 , 例如 第 i 号 习 硅 9) 变 
量 表 示 自 变量 %， 第 4 十 1 (i 所 p) 号 变量 表示 因 变 量 轨 。 和 矩阵 
FLw 对 某 一 编号 所 9 十 Pp》 按 公式 (4.12) 进 行 消 去 变换 而 得 
到 Lt5， 仍 记 为 


< 


下 (my 一 Linmtry 
在 训 重 娘 选 中 还 要 涉及 到 只 对 工 中 的 部 分 子 算 阵 进 行 消 走 变 换 ， 
履 用 记号 
| Lim) [2 Lemtn 
表示 对 L'” 中 的 三 块 子 第 阵 工 器 ', 工 知 ， 工 她 ) 进行 天 消去 变换 ， 
而 子 块 工 加 人 课 持 不 变 。 类 候 地 用 记号 
(Ky) 


Lin) se m+1ly 
表示 只 对 Lm 中 的 子 块 加 进行 消去 变换 ,而 其 它 三 块 工 疗 、 
工 噶 、 工 园 保持 不 变 。 
因为 在 计算 过 程 要 对 自 变 量 和 因 变 量 进 行 利 选 ， 故 取 两 个 临 
界 值 (注意 这 两 个 临界 值 随 着 变量 个 数 的 变化 而 不 同 ， 但 为 了 方 
便 , 根 据 经 验 取 成 两 个 常数 ); 
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Fr F,. (2 9+2), 


2 2 J 
FE 一 Fi 人 (全 一 十 全) C4.21) 
其 中 必 和 避 为 给 定 的 显著 水 平 。 并 且 令 . 
LP LY L® (4.22) 


每 建立 了 一 组 因 变 量 的 画 归 方程 ， 就 称 为 一 个 阶段 的 双重 入 
选 结束 
第 一 步 : 任意 选 入 一 个 因 变 量 #， 即 对 LP 和 LI 进行 下 
谭 的 消去 变 黎 
Le 
然后 转 人 第 二 步 。 
第 二 步 ， 逐 个 检验 是 否 要 引入 自 变 量 。 
设 这 时 已 引信 了 pp 个 因 变 量 , 8 个 自 变 量 ，5 与 了 9 已 相 
应 地 变 成 Lf"? 和 Li" ,计算 
sg 


Ai 一 (i 1,2,..*,9) (4.24) 


《a 


i 
《8 二 72 革 }》 LO, LY LD (4.23) 


其 中 分 别 为 LD 和 -上 LY 的 (1, 认 元 素 . 注意 到 对 已 
人 人 选 的 自 变 量 的 如 之 0， 对 末 入 选 的 自 变量 的 4: 当 0， 在 大 于 
零 的 4, 中 找 出 最 天 的 , 设 为 4i， 计算 
spl i 
Pa 
如 果 Fi 所 F*， 不 引信 sy 再 转 人 第 四 步 。 
如 果 FE > FRx， 则 引信 my 即 做 下 述 消 去 变换 


Lm oO L' mi Lim+h {4.25) 


然后 转 入 第 三 步 ， 
第 三 步 : 逐个 检验 是 否 要 剔除 自 变 量 。 
设 这 时 已 引 人 了 个 因 变 量 ， 4 个 自 变 量 ，L 与 LY 已 
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相应 地 变 成 了 97?， 工 所)， 计 算 
和 一 一 融和 全 一 1 C4.26) 
对 已 人 选 的 自 变 童 的 4 三 0, 未 入 选 的 自 变 量 4 守 0， 在 小 于 
零 的 4i 中 找 最 大 的 (绝对 值 最 小 ), 记 为 A ， 并 计算 
F, ~ el A (4.27) 
p, 


若 包扎 Ft+， 则 崭 除 #;,， 即 做 消去 变换 
CY (i) 


Li "mt , Li™ — LL "td 

然后 转 人 第 二 步 。 

若 名 , > 好 ， 则 不 曙 除 *,。 转 人 第 二 步 . 

第 四 步 ， 逐 个 检验 是 否 要 列 除 因 变 量 . 

设 这 时 已 经 引入 了 p, 个 因 变 量 , 4 个 自 变量 ，L 人 0 与 多 已 
变 成 Lf” 和 LI”?， 计 算 

A ™ 1 — Nxtpilixern CP) (4.28) 

对 干 已 移 信 的 因 变 量 oj ( 即 9 十 了 变量 ) 的 hwi < 0， 对 未 选 人 
的 因 变 量 的 “A, 关 0。 在 小 于 零 的 A6+; 中 找 一 个 最 大 的 绝对 
值 最小), 设 为 9g 十 庆 ， 并 计算 


名 一 一 £2 AH (4.29) 
若 名 < Res， 则 剔除 #5,， 即 做 消去 变换 
工作 (9 + 7x) LimtD, Li™ mt) (4.30) 
然后 转 入 第 三 步 ， ， 
车 久之 FE， 则 不 日 除 xj,, 转 入 第 五 步 、 ~ 


第 五 步 : 逐个 检验 是 否 要 引 人 因 变量 ， 
设 这 时 已 引入 六 个 因 变 是 ，4, 个 自 变 量 ，Zi 和 LS 相应 
已 变 成 Li 和 Li”, 计算 
4 一 1 一 站 et (ip) (4.31) 


同样 ,对 已 人 渤 的 因 变 量 都 有 Ayti < 0， 而 对 未 人 选 的 因 变 量 都 
1 867 ， 


有 Aiti 之 0， 在 大 于 零 的 4,+; 找 出 最 大 的 , 记 为 4 并 计算 
天 一 志 一 9 一 1 A 
多 1 一 放生 
若 Fi 所 Fs， 则 不 引入 = 转 入 第 六 步 . 
若 For > Ft， 则 引入 zi,， 即 牧 消 去 变换 


《9 十 RY {9 十 下 
-一 -一 一 -一 一 -> 


五 二 


了 


Li™ 


然后 转 人 第 三 步 ,， 

第 六 步 : 给 出 第 一 组 因 变 量 的 回归 方程 式 . 

当 出 现 既 不 能 吻 除 又 不 能 引 人 变 量 时 ， 第 一 阶段 的 双重 第 选 
停止 。 此 有 时 LD 与 LD 变 成 LP? 和 LIL?， 设 选 入 的 因 变 量 为 
xz" 选 人 的 自 变量 为 zi,… 加,， 则 由 LL? 可 写 出 第 一 
组 画 归 方程 式 

区 Bi OO 


Ls+h 3 互生 


t 
Li™t 了 


i Ng HC 一 3) 十 … 十 Hcg rint si 一 康 ,) 
(4.32 

第 一 阶 毁 的 双重 筛选 结束 后 ， 去 掉 第 一 阶 毁 人 选 的 因 变 最 
x xs 用 镜 下 的 因 变 量 和 全 部 自 变 是 重复 上 述 的 各 步 台 进 
行 第 二 阶段 的 饰 选 ,建立 起 第 二 组 回归 方程 式 ,-… 如 此 类 推 ， 直 到 
全 部 因 变 量 用 完 ,这 样 就 结束 了 整个 双重 伺 选 逐步 回归 . 

例 4.2 为 了 分 析 自 然 经 济 及 气候 条 件 对 森林 覆盖 面积 的 消 
长 影响 , 取 了 12 个 点 进行 调查 , 共 测 定 了 12 变量 ， 其 数据 列 于 表 
4.2， 表 中 变量 的 章光 是 : 

z= 地 比例 ( 徊 )，zz 一 人 口 密度 CC 人 Em) ，#3 一 人均 收 
入 增长 率 (元 /年 )，xw, 一 公路 密度 《 百 米 / 公 顺 )，z; 一 前 视 期 降 
水 量 ( 量 米 / 年 )，s 一 后 汛期 降水 量 《 昌 米 / 年 )，sy 一 月 平均 最 
低温 度 ， 

+ 一 森林 覆盖 率 ( 免 )， 思 一 针 时 林 比 例 (%)，# 一 造林 面 
积 ( 干 军 /年 )，x, 一 年 采伐 本 积 ( 干 调 /年 )，x: 一 火灾 括 数 【次 / 
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率 4.2 例 4.2 中 各 变量 的 数据 表 


! | i ! | 


年 ). 
按 逐 步 回归 程序 ,到 F? 一 2，P? 一 2.5， 这 时 将 5 个 因 变量 
分 成 了 三 组 。 其 相应 的 回归 方程 为 


第 一 组 : 
4 一 52.91 十 0.8202, — 0.057z。 一 0.425z 一 2.883g, 
1 二 一 47.79 二 0.130z, 一 0.0418: 十 0.623z; 十 2.8908, 
第 二 组 ; 


让 一 72.68 十 0.435%, 十 0.08452 十 5.444z 一 G6,017s; 

4 一 一 205 一 0.067z — 0.036%; + 2.659%, 十 0.4168y 

第 三 组 : 

人 二 一 38.99 十 0.9282 — 0.2963; 一 2.865z; 十 26.026¥, 

出 上 述 计 算 结果 表明 ,森林 覆盖 率 x,》 和 采伐 面积 (x,) 受 
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色相 局 自 蛮 县 的 影响 , 即 受 到 山地 比例 〔s》， 人 口 密度 《sz ， 人 
均 收 入 增长 率 (zs) 及 月 平均 最 低温 度 (x;》 的 影响 ; 针 夺 林 比 例 
《xz) 和 火灾 频数 (xs) 主要 受到 公路 窗 度 (x4) 和 和 最低 气 沁 (x1) 影 
唤 ; 而 阁 林 面积 x3》 主要 受到 公路 密度 (2z1》》 和 和信 均 收 人 增长 率 
(zs) 的 影响 。 


$6.5 多 元 方 束 分 析 


在 一 元 统计 中 ， 我 们 蕉 起 一 个 因素 对 试验 结果 (单个 手 标 ) 是 
否 有 影响 ;这 就 是 单 向 分 类 问题 ; 若 考 虑 两 个 因素 对 试验 结 采 ( 单 
个 指标 ) 是 否 有 影响 ,这 就 是 双向 分 类 问题 ， 它 们 所 用 的 检验 统计 
重 都 是 了 绕 计 量 。 如 果 上 述 的 试验 结果 是 多 指标 的 ， 就 是 多 元 方 
差分 析 的 任务 。 它 的 因 想 方法 与 一 元 完全 相似 ， 只 是 统计 量 攻 为 
Wilks 的 4 统计 量 、 在 本 节 里 我 们 将 对 多 元 方差 分 析 中 的 单 向 分 
类 问题 进行 较 详 细 的 讨论 ,而 对 双向 分 类 问题 作 方 法 上 的 介绍 ,不 
作 详 尽 的 证 明 。 

(一 ) 单 向 分 类 . 

在 讨论 间 向 多 元 方差 分 析 之 前 ， 我 们 回顾 一 下 单 向 一 元 方差 
分 析 是 十 分 有 益 的 。 

沽 虑 因素 4 对 试验 结果 * 是 否 有 显著 影响 ， 设 4 取向 个 水 平 
(等 级 ): 4 de， 在 第 了 个 水 平 4 之 下 做 南 次 独 并 试验 ,用 
ryti 1 表示 在 A 之 下 的 第 1 次 试 
验 结果 。 每 水 平 之 下 视 为 一 个 总 体 , 而 该 水 平 之 下 所 做 的 次 试 
验 为 该 总 体 的 一 个 容量 为 的 样本 . 设 这 放 个 总 体 都 服从 正 态 分 
布 NCOp0) 全 一 1,2,.**, m)， 要 推断 A 对 试验 结果 有 无 显著 
影响 ,就 等 价 于 检验 : 

于 不 全 相等 (5.1) 
为 了 方便 分 析 , 引 人 一 个 量 1 一 pi 一 yp， 这 里 
nip sn DY me 


j= 
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这 样 pi 二 gp 十 二， 并 称 z 为 因素 4 的 第 ?个 水 平 的 效应 ， 此 

讨 , 检 验 (5.1) 就 等 价 于 检验 - 
0 万 :ri 不 全 为 零 C5.2) 
如 何 来 签 验 (5.22? 呢 ? 必须 千 给 出 重型 , 由 前 面 记述 第 了 个 总 

体 的 第 ; 个 观察 值 具 有 下 述 形式 
人 -grt ey 

Ei ~ NC0,0”) (或 mi 一 NI 十 mi) 
称 (5.3) 为 单 向 一 元 方差 分 析 模 型 ， 其 中 sr 为 误 闭 。 对 于 单身 一 
元 方差 分 析 正 是 基于 (5.3) 对 于 具体 试验 数据 《 仍 记 为 x;) 进行 分 
解 : 


C5.3) 


Ti 《一 一 {5.4} 
其 中 至 . 为 全 部 观察 数据 的 半 均 .五 .为 第 i 个 总 体 的 ;个 现 察 数 
据 的 平均 。(5.4) 蕊 右 端 三 项 分 别 作为 《5.3) 中 的 ,tr， 和 55; 的 信 
计 .(5.4) 式 也 可 以 写成 

j Ke Bi ee) Cr C5.5) 
对 于 (5.5) 式 可 以 这 样 来 解释 ; 左边 《ef 一 各.) 是 数据 mi 对. 
的 偏 富 , 这 个 偏离 可 分 解 为 两 部 分 组 成 ， 一 部 分 为 4 水平 效 应 引 
起 的 , 即 (5. 一 不 .)， 一 部 分 是 误差 引起 的 , 即 (xa 一 27.)。 我 们 
将 (3.5) 酚 边 平方 后 求 和 仍 有 同样 的 结构 式 , 究 实 . 上 
DD 一 元 闻 一 DE — Et — BP 


jm j=1 d=1 ji=1 


-> bp (Ti — 2) p> (Bi. 一 Er OK) 


Et jul fmi fel 


+ SS Co 一 下 


#41 1 


| 


>) > Cr 一 EY 十 >) Sm 一 tk;.) (56) 
i j=l i=1 1=1 


上 式 最 后 一 个 等 号 是 因为 交叉 乘积 求 和 项 为 0， 记 
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-加 > smi) 4 已 六 经 一 天 


=~ 


一 3 六 Cri 一 ze) 


“ t=1 41] 
并 分 别称 为 总 的 离 差 平 方 和 ， 效 应 平方 和 以 及 误差 平方 和 。 从 而 
《5.6) 式 可 简写 为 


d= Sa 十 S。 (5.7) 
要 检验 假设 (5.2) 只 须 把 5 与 8 进行 比较 。 检 验 统 计量 为 
aml 

F Sa C5.BY 


在 一 元 方差 分 析 中 已 证 明 {5.3) 式 的 当 入 ,成 立时 是 服从 自由 度 
为 {zm 一 1 # 一 霹 )》 的 五 分 布 ， 因此 对 于 临界 秆 RF, tm 一 1， 
一 #9)， 攻 

F>F_(m— ln om my 
则 拒绝 HH,, 到 因素 A 对 试验 结果 有 显著 影响 ， 告 则 没有 显著 影响 
通常 我 们 把 上 述 过 程 列 成 一 个 方差 分 析 表 ( 表 5.1)， 


囊 5.1 单 向 一 元 方 着 分 析 泰 


方差 来 源 - 平 方 和 [ER F 信 


mi | surm—l 
因 案 的 影响 ;S54 = DD) Dy (i 一 .|m-1l sam — 1| Bn 


1 jm 


| 一 一 


5 得 一 lsun—m | 


与 一 元 情况 相 类 似 , 我 们 考虑 单 向 的 多 元 方差 分 析 , 设 试验 结 
果 是 多 指标 , 即 视 为 一 个 向 量 , 不 妨 设 为 维 。 因 素 4 取 才 个 水 平 
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二 4 在 第 i 个 水 平 下 作 sm 次 独立 试验 ,用 向 量 xij 表示 在 
第 让 水 平 4; 下 做 的 第 i 次 试验 结果 ， 把 同一 水 平 下 的 ma 个 试验 
结果 视 为 同一 总 体 的 一 个 容量 为 % 的 样 东 。 设 这 各 个 总 体 都 是 
P 维 运 访 总 体 NeKR ZE) 一 1,2 ,wm)， 它 们 有 公共 的 苏 方 
差 种 阵 了， 又 推断 4 对 试验 结果 有 无 影响 等 价 于 履 验 
不 全 为 [0 {5.9) 


引 人 因 素 水 平 效应 向 量 5 一 一 p (pp 一 二 DD nip) 后,(5.9) 
可 写成 


Hi 一 0 Hf 不 全 为 人 0 《5.107 
由 上 所 述 第 i 个 总 体 的 第 i 个 观察 向 量具 有 下 列 形式 
人 si "sik /i sf 
Bi ~ NO 【成 x ~ Np FE)) 
其 中 全 为 误差 向 量 。 称 (5.11) 为 单 向 多 元 方差 分 析 模 型 , 显然 是 
线性 模 型 。 注 意 到 Ee 一 六 局 一 2p 一 0， 并 记 


i 二 1 


Tx, 是 -一 3 


Ri ei # ns fo 


根据 神 型 (5.11), 对 于 具体 的 观察 向 垦 ( 仍 记 为 x;;) 可 分 解 为 
一 元， 十 《和 元- 一 完 ..) 十 《Ki 一 车 


(5,11) 


或 
Xi 一 二.. 《Bl. — 2..) 十 【和 一元) (5.12) 
这 个 分 解 导致 了 交 玉 秆 积 (xi 一 不 .》(xj 一 站 .了 可 分 解 .多 
《Xi 一 元 .)Czii 一 症 .3 一 [(Xi. ..) 
十 《区 六 -一 i.) [CR 一 二. 十 (iy 一 元 ;了 
= 于 一 
十 《过 i 一 二 .Xij 一 二 ji- 十 (ii 一 第 (Ri 一 这 ,.) 
注意 到 
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立 Cx 一 元 j.) =— 0, > 旨 i 远 ;. 一 总 二 《5.1 3 
于 1 


一 1 


然后 将 上 式 对 17 求 和 人 恒 得 到 
2 > 《xi 一 十 并 一 天, 
= f=l 


一 > (Tj;. 一 .CE — .YY 


二 2), 《x 一 Fi CX 一 部 
i 


=1 i=1: 


以 0,8,E， 各 分 别 记 


9 一 习 2 (em — a ey, 


(5.14) 


四 一 > 天， 一 项- 外 半 ;. 一 天 .站 


Li | 


Ei 一 >， (Xi ~ Ri) CX TF) 
f=1 


E=— 2, Ei 一 总 Ds — Kix — Ey 


[| 


则 (C5.14) 可 简写 为 


如 一 六 十 五 (5.15Y 
仿照 一 元 情况 的 类 似 称 呼 , 称 8 汶 总 离 差 “平方 和 ”矩阵 , B 为 因素 
的 效应 "平方 和 ” 乱 阵 ,EE 为 误差 “平方 和 ”和 兴 阵 . 

为 了 今后 讨论 的 方便 , 令 
Cl, Cm ls,, Mi~ pl’,, 
MM 一 {Ms** ,Mn), MM, 一 Kl., 及 一 Cs ) 

其 中 Xi 一 《xi ie 为 第 i 个 总 体 的 样本 算 阵 ， 那么 上 面 

记号 中 的 下 就 是 名 个 总 体 的 样本 组 成 的 XX 未 阶 和 矩阵 ， 这 样 ， 模 
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型 (5.41 可 表示 为 


KX~ NM (E>0) C5.16) 
检验 (5. 9 或 者 (5.10)) 就 等 价 检 验 . 
H: M—M, HH: MM, (5.17) 


注意 到 引入 上 述 记 号 后 ,还 有 下 面 的 关系 式 成 立 : 
总 一 > > (xi — .xy 一 二 一 XCX 《5.187 


下 


五 ; 一 位 【Xi 一 Ri Cxis 一 EY 一 XCIX (5.10) 


fl 


如 何 检 验 C5.17XC 即 如 何 检 验 (5.9) 或 <5.10))? 下 面 的 两 个 定 
理 分 别 给 而 了 检验 统计 是 及 其 分 布 . 

定理 51 对 于 单 向 多 元 方差 分 析 模 型 (5.16), 栓 验 假 设 
《5.17) 的 极 大 位 然 比 绕 计 量 是 

A= |E|I/IE + 8] (5.20) 

其 中 BB 和 加 为 (5.15 ) 式 所 示 。 | 

证 明 设 2 一 {ny 25): TF>0, pgp 任意 1 ， 已, 一 
{Re 了 > 0 一 …: 一 .那么 在 呈 下 的 似 然 函 数 
为 


Lp -pe 5) — Cr) BIE| ?exptr lr |—; 1 
x EX— MIX— MY 直 
一 C2) lz| 1 < 位 | 于 
x 3 — MCK, 一 uo 
C27) 7 21 I efee [= 二 
X EHE + nla. 一 pr HK, 一 pp)) } 


+» R73 + 


[和 全 下 


时 ,上 述 亿 然 通 数 达 到 最 大 , 即 
TAX LCM,- * “pm ) LOR,: ” “2) 


(由 
在 9, 下 ( 即 及 ,成立 时) 其 似 然 函数 为 
Lie, " "Emr 工 (《 和 -至 :三 
-于 - lr- 一 一 
一 (2z) Fa) Soplu [~— 1 72- 一 MOCX uy]} 


一 (27) YF) exp fu [- 1 
x FAO + a — CR, — py) } 


从 而 当 玉生 取 - 
看 党 ..， 3 — 1 0 
pn 
时 ,上 面 的 亿 然 函数 达到 最 大 , 即 
max 一 Cn) | ?| exp( 叶 | 


故 似 然 比 统计 量 为 


A 


max 元 (和 “pm, 3) (18! 》 
max Lp-**pe, 2) 
它 是 等 价 于 
A |EIIOI ~ IEIIE+ BI 外 
定理 5.2 在 (5.17) 中 的 万 , 成 立时 , 则 有 
A IEI/IET BI) ~ Atpyn ~ mm 1) (5.21) 
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证 明 在 贱 成 立时 ， 基 ~ 村 ,1)。 由 于 C 是 投影 
阵 , 且 rkC 一 2 一 1，M.C 一 0， 根据 第 三 童 推论 2.5, 就 有 
QO= XCX ~ Wr— 1,2) 


同样 ,由 EE 一 3) Ei 一 DXCX = XCX, C= diagCC,, 
| t=1 


Cm) 也 是 投影 渐 , 且 fC 一 > (a 一 1) 一 7 一 ww， MC 一 0. 于 


是 有 . 
E= XOX ~ Wn— mE) 
由 (5.15) 式 知 
B— OE XCX— XX = KCC— HIT 
由 CE 一 EC 一 人 可 推出 CE 一 也 是 投影 阵 , 且 M,C 一 从) 
=0, rkCe — CY triC— Cm {nm 1)— (no mm— 1, 
(CC 一 C) :一 0， 从 而 由 第 三 章 定理 2.9 知道 E 和 8 相互 独立 ， 
按 Wilks-4 统计 量 的 定义 全 证 明了 定理 。 是 
由 上 可 知 检 验 (5.17X( 或 (5.9),(5.10)) 的 步骤 如 下 : 
C1) 分别 计 算 B 和 ECO@ 一 互 十 已)。 
《2) 求 出 A 一 18E111B 十 El. 
(3) 对 于 给 定 的 显著 水 平 a, 求 由 4。 使 得 PCA(p,n 一 m， 
二 一 1) 之 4A,) 一 %《。 如 果 当 各 一 1 为 1 或 2 时 ; 可 利用 第 
三 章 的 表 3.1 化 为 F 稳 验 , 然 后 查 F 表 ,否则 利用 第 三 章 (3.6) 式 查 
达 表 近似 地 求 出 。 
_ 《4?》 根据 临界 介 来 推断 FH, 是 否 成 立 。 

最 后 我 们 可 归 成 一 个 方差 分 析 表 ( 表 5.2). 
` 枫 5.1 考查 医院 所 有 制 对 医疗 费用 的 影响 ， 所 有 制 分 三 种 : 
(1) 私立 , (2) 非 殉 利 组 织 经 营 ，(3) 政府 开办 ， 医 疗 费 用 由 四 个 
分 量 组 成 :x, 一 护理 费用 ，x; 一 聘 食 服务 费用 ，x; == 设备 使 用 
及 维修 费用 ， 一 房产 管理 及 洗衣 费用 .。 这 四 个 费用 都 是 以 每 
个 病人 每 天 开支 为 基础 计算 的 ， 三 种 类 型 的 医院 分 别 观 察 到 的 样 
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表 5.2 单 向 多 元 方差 分 析 裘 


Ee 
区 各 次 差 短 阵 和 自由 度 | 统计 量 
机 来 的 Bs Se ey ， 
影响 > a 
一 一 - 四 | 

二 8+E 
说 着 EE >) CO HE 18+ El 


一 in1 


册 bd 
总 和 Om B+E= 3, (ms — 2,. Mx 一 下 ,小 nl 


本 淘 信 向 量 及 样本 的 协 方差 矩阵 分 别 如 下 : 


2.066 
0.430 
0.082 
0.360 


秘 立 ; 所 一 271， 元 .到 | 


0.291 
一 0001 0.011 
0.002 0.000 0.001 
0.010 0.003 0.000 0.010 


2.167 
0.596 
非 企 利 组织 : 好 138, 于 :一 0.124 
0.418 
J.5B1 
T0011 .0.025 


5, 一 
- 0.001 0.004 0.005 


0.037 0.007 0.002 0.019 


= 278 + 


2.273 


0.521 
和 于 开 东 : w= 07 ， 训 ;、 一 
政府 开办 : #3 让 0.125 
站 383 
.261 
0.030 0.017 


3 


0.003 0.000 0.004 
0.013 0.006 0.013 0.0153 


于 是 可 以 计算 得 
:2.136 
_ S _ 0.519 
二 .，< 一 一 nia 
» fe 0.120 
0.380 


注意 到 5; 是 样本 协 方 莽 答 阵 , 见 


mF 
名 一 一 > {Xi 一 EK 一 天 -一 1 Ei 


Ni 1 jia i 
所 也 
182.962 
3 4.408 8.200 
Em S| 0633 1.484 
9.581 2.428 0.394 0.538 
3.475 
3 1.111 1.225 


本 一 江天 i;. 一 充 ,， 元 一 看 ..)》 一 
名 所 从 . Yo.821 0.453 0.235 


0.584 0.610 0.230 0.304 


由 此 计算 出 
A= |EI/IE FB|= 0.7714 
本 例 中 p 一 4， R16 ，m 一 3， 所 以 由 定理 5.2 
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知道 4 ~ 4 (4,513,2), 这 里 和 一 1 一 2。 由 第 三 章 表 3.1 知 
一 5309 .1 一 VA4 
4 vA 
此 而 北 成 FF 检验， 皮 a 一 001， 根 据 自 出 订 查 囊 得 到 临界 值 

Fof(8 ,1018) 一 2.52， 而 


F ~ FC(B,1018) 


F309. -VA 17.63 > 2.52 
4 A 
所 以 在 ga 一 0.01 之 下 拒绝 原 假 设 H,。 即 三 种 类 型 医院 的 平均 医 
疗 费 用 有 显著 差异 . 

如 果 我 们 对 由 个 分 量 x;(i 一 1,2,3,4) 分 别 用 一 元 方差 分 析 
进行 处理 ,看 其 结论 又 如 何 . 由 于 E ~ 玉 ,(n 一 mm,3),，B ~W， 
《w 一 1,2)， 且 相 互 独立 ,所 以 它们 的 对 角 元 素 er 一 22C* 一 四 ) 
Gn bi ~ XA 一 1)*oarn 且 相 互 独立 ,由 此 可 得 一 元 方差 分 析 的 
检验 统计 量 


Fadil Fm—1ln— m) 


isl n 一 + 
于 是 利用 己 和 中 的 对 角 元 素 求 得 
F,” _3.475/2 4.8727 Fm 225/2 一 38.3186 
182.926/513 3.200/513 
,一 -04235/2 -一 40.6183 已 一 8:304/2 144.9368 
1.4841513 0.538/513 


查 F 表 得 临界 值 F, wl2，513) 一 6.63。 将 Fi 与 6.63 比较 、 发 现 
指标 mm 与 内 有 显著 差异 ， 而 指标 *， 即 护理 费用 可 以 认为 无 
显著 差异 。 

从 此 例 看 出 ; 当 我 们 便 用 Wilks 的 4 统计 盟 进 行 多 元 方差 
分 析 时 经 党 与 一 元 方差 分 析 相 结合 ， 多 元 的 具有 全 面 考 察 的 特 
点 ， 而 一 元 则 可 能 发 现 各 指标 间 的 差异 ， 两 者 相 结 合 ， 结 论 更 可 
靠 ， 
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*( 二 ) 国 素 效 应 的 同时 钾 信 区 间 

当 假 设 有 Hp 一 一 pj 被 拒绝 后 ,我们 感 兴趣 的 是 那些 
均 信 不 等 的 总 体 之 间 的 均值 的 分 量 差 的 同时 四 信 区 间或 者 它们 的 
级 性 组 台 的 同时 置信 区 间 。 共 直观 意 尽 是 这 样 : 若 第 上 个 总 体 的 
均 慎 向 是 p, 不 等 于 第 + 个 总 体 的 均值 向 量 jg,， 我 们 希望 估计 出 
上 与 zu 分 且 之 间 偏 差 的 情况 。 在 本 段 中 我 们 介绍 Roy 的 方法 ， 
为 是, 先 作 一 些 准备 工作 。 

设 工 一 《hpe) 是 户头 本 阶 皇 阵 , a 是 任 一 靖 维 向 景 . 
“是 满足 ol, 一 0 的 所 维 疝 量 , 即 e 一 《cc 的 各 分 担 满 


足 Da 如 取 a 一 (1， O07-07, el,—1,0,.…,.0), 


则 aTc= 一 py 一 Tr 一 Ty 下 是 第 一 总 体 和 第 二 总 体 的 均 
值 差 的 第 一 个 分 量 。 
设 


Ei NeC0,Z) € = 1 2, 


一 让 >) nn) 
记 党 富 (全) 第; 一 《部 ，， 证 i)， 则 
~ ND, 3,1,) C5.22) 


类 似 于 定理 5.2 的 证 明 ( 取 好 ,一 0， 以 各 代替 蕊 ) 立刻 可 得 到 
Eo > Ci 一 各 Gas 一 各 了 


一 他 3 《2 — Xi Ri — Rey 
EE~ Wln— m5) (5.23) 


— Sn 涉案 ;一 完 ,. 了 完 ,一 证 了 


f=1 


by > HR — KF. 一 EE CO TY 


d= 


238， 


~ Wm 一 1,5) (5.24) 
且 久 和 区 相互 独立 . - 
设 gaax 是 | 全 一 六 | 一 0 的 最 大 特征 根 。 bs。 是 1 一 
BE 十 荔 | 一 0 的 最 大 特征 根 。 则 由 于 
lS— AaB+E! = 1(1 — OF | 


9 gl-o 
二 6 


{1— Oi 
1 


所 以 有 

mmax mm gxj/ 1 一 Oonas (5.25) 
用 和 如 分别 记 fw 和 bx 的 “分 位 点 ， 若 PCnmar < 和 
二 a， 由 于 osx 是 和， 的 增 函数 《由 ?ax 六 0 及 (5.,25) 知道 


0<0wr<1)， 所 以 若 PC9wws<9.) 一 a， 则 有 P( rnss < 一 名 一) 


一 x, 因 此 加 一 911 一 名， 即 得 到 ?ax 与 Du 的 5 分 位 点 之 间 

关于 和 的 分 布 经 前 人 的 研究 已 制 成 了 = 分 位 点 表 ( 书 去 附 
表 45)。 在 比 对 附 表 45 中 0。(p， ma，m se) 的 各 个 参数 的 意 
义 作 一 点 说 明 ; 车 A~W,Crms2), B~W,tns2),， Op,, 
nf ey) 下 是 [4 一 (A 十 B)| 一 0 的 最 大 特征 根 9 分 布 
的 “分 位 点 。 由 此 可 知 | 六 一 BC( 入 十 篆 | 一 0 的 最 大 特征 很 的 
a 分 位 点 正 是 9p 一 办 六 一 15o)。 


有 了 上 述 的 准备 工作 ， 下面 我 们 给 出 a'Te 一 >) cia'p， 的 


同时 置信 区 间 ， 
定理 5.3 对 于 单 向 多 元 方差 分 析 模型 (5.11), 当 # 一 之 p 
时 ， 对 于 任 一 维 向 最 a 和 满足 sl。 一 0 的 w 维 向 量 ec,，a'Te 


= -am 的 1 -一 e 同 时 置信 区 间 为 
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(S 全 元;, 十 | 0 ， qa 。 (位 S ) (5.26) 


一 号 i=1 Mi 
其 中 0 一 Gwe(P sn 一 各 ,nw 一 1,0)， 则 bu。 的 上 分 位 点 。 
证 角 与 7 一 Cp,…… ,pn) 相 对 应 ,我 们 记 全 一 (,.,-……， 
守则 有 
ET = T, El(afej—aTe, 了 一 Ri 一 下 (5.27) 
利用 第 一 章 引 理 3.1 中 的 Cauchy-Schwarzs 不 等 式 ， 即 对 尾音 二 
个 p 维 向 量 68 及 d 有 


(bd bh (dd) (5.28) 
令 
d — Cnrde ,Hideo) 一 TdiagCn -oa 二。ef5.297 
5 一 Cada’Cx. 一 无. 一 下}, la’ CX. 一 元 .一 下 
一 [diag(z -ne dia — VV o£. (5.30Y 


注意 到 (5.27),(5.24) 式 及 1%c 一 0， 从 而 有 
bd a — V2 一 a'T( 人 全 — Vc zz.1’e] 


一 a 个 一 TYe 一 >, Cid’ CE,. -一 Mi) C5.31) 
dd ~ ediaglms sy fa) ‘OC™— >, (C5.32) 
f= 帮 | 


p= >, ne CFE; 一 元， 一 下 于 


f=1 


= bp3 类 CR 一 证， 一 Rr)|a 
| | 


to=1 
一 a'fa (5.33) 
将 (5.31)~(5.33) 代 入 (5.28) 得 到 


四 


[et 一 Tc 一 | ceca — po 
| 
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之 aia. 4 (C5.34) 
由 第 一 章 推 论 4.2 知道 ， 对 于 任 一 ? 维 向 纵 。 有 一 


do 


T= Wmaxr 


a 
max 一 一 
™ aEa 


其 中 ws 是 五 相对 于 天 的 最 大 特征 根 。 即 1 生 一 意 | 一 0 的 最 
大 特征 根 。 在 (5.34) 式 两 边 同 除 aa， 
La-T)e Sd (“Be) < 3 


a'Ea = A aEa i 1 . ma 
从而 有 
[a(F — Tel — ba ca'(x, — pi) | 
机 全 
二 (2 “aE na 
或 省 写成 


oat, -Doan < 


j 一 1 


| 
和 | (5.35) 
对 于 给 定 的 显著 水 平 a, 可 得 5 使 得 


二 
< 


由 (5.35) 式 知道 事件 . 
{3 fia Wax )< (> 2 .aia . 2 


二 1 一 1 挤 i 


发 生 必 导致 事件 
{| 2 ea -Doanml< < 


于 和 和 
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发 生 , 其 概率 不 会 小 于 1 一 a。 注 意 到 加 一作 ,这样 我 们 


就 得 到 这 cia'p 的 1 一 a 同时 置信 区 间 为 (5.26) 式 : 县 


di 
例 5.2 在 例 5.1 中 我 们 看 到 医院 的 平均 费用 与 其 类 型 有 关 ， 
应 用 定理 5.3 我 们 可 以 比较 费 岂 差异 的 大 小 。 殴 如 比较 私立 医院 
与 政府 开设 的 医院 的 设备 使 用 和 维修 费 ww 即 要 求 力 me 一 ps 
的 置信 区 闻 。 为 此 取 e == (1,0, 一 1》， a 一 (0,0,1,0》 于 是 有 


ST 0.01304, aEa 一 1.484 


fa fi 
土产 一 4 ~ 513, 一 2 查 得 Bs 一 Bt4，513，2, 0.95) 
一 0.025( 注 意 书 末 附 表 45 对 于 # 只 列 到 101, 当 ww 这 101 时 要 查 
更 详尽 的 表 》。 因 此 jp 一 ps 的 0.95 置信 区 间 为 


(~—0.043+ | 0.025 


# 
2 .4484 0.01304| ) 
1 — 0.025 ) 


= (—0.065,—0.021) 
这 说 明 ， 政 府 医 院 比 私 立 医院 在 设备 使 用 和 维修 费 方面 要 高 出 
0.021 到 0.065, 

用 同样 方法 可 求 得 pw 一 px 的 0.95 置信 放 间 为 《一 0.026， 
0.024), 而 0 属于 该 区 间 内 ,这 说 明 非 僵 利 组 织 办 的 医院 与 政府 办 
的 医院 的 设备 使 用 与 维修 费用 无 显著 差异 ， 这 正 是 对 例 5.1 的 讨 
论 的 更 细微 的 补充 . . 

(三 ) 双向 分 类 

现在 若 虑 两 个 因素 4 与 B 以 及 它们 的 交互 作用 4 x 8 是 否 对 
试验 结果 有 显著 影响 的 问题 。 设 因素 4 取 # 个 水 平 ， 4i(i 一 1， 
2,………, mm)， 因 素 B 取 :个 水 平 ， Bj(j 一 1, 2,……,s)， 共 有 坊 x 
zx 个 配合 ， 由 于 要 考虑 交互 作用 ， 闪 而 必须 在 每 一 个 配合 下 做 重 

87。 


得 试验， 并 设 重复 1 次 Gt 之 2)， 每 次 试验 结果 是 一 个 了 维和 疝 量 
xx， 用 zk 表示 因素 肛 在 第 i 水平 ， 因 素 8 在 第 j 水 平 下 所 做 的 
第 二 次 试验 结果 , 海 虚 下 列 的 模型 : 
Xi ™ Hii 十 Eiit 
ii Not0,T) 且 相 互 独立 Ci 1 2, {5.36) 
| 一 2 
为 了 今后 便于 讨论 和 解释 ,我们 令 


一 -了 yp 站 -i 一 
Hf 一 1 j=1 1 


Tp FR BF. 

Yi Ri (RnB pp 
其 中 ,Bi 分 别 表示 因素 4 的 第 i 水 平 的 效应 和 因素 了 的 第 i 水 
平 的 效应 ,而 yu 表示 它们 的 次 互 作 用 的 效应 ， 如 果 不 存 在 交互 作 
用 ,出 Yi 一 0。 由 上 所 述 不 难 验 证 有 


D0 DB-0 DVT 0, PD Ys— 0 (5.37) 
Rm jl 本 一 3 了 一 圭 - 


成 立 。 此 时 我 们 可 将 寞 型 (5.36) 改 写 为 
x = Pt hi;t Yi ei 
Bh ~ NpC0, 了 2)》 且 相互 独立 Ci 一 1,2,-…… ,nm。 (5.38) 
j= 2 5， 下 me 2 
由 模型 (5.3 拉 可 知 ,考查 因 素 4, 因素 互 及 它们 的 交互 作用 对 
试验 结果 是 否 有 显著 影响 就 等 价 于 检验 如 下 三 个 假设 : 
HD 不 全 为 0 (5.39) 
五 :有 一 太一 … 一 有 一 0 Hi B; 不 全 为 0 (5.40》 
Hs: Yi 一 0《 一 切 i 和 让 ”Hs: Yi 不 全 为 0 (5.41) 
下 面 直观 地 介绍 检验 (5.39)~(5.41) 的 问题 , 硒 不 作 具 体 的 还 
明 。 对 于 每 个 观察 结果 作 下 烈 的 分 解 ， 
im 十 《元 一 训 ) 十 (于; 一下) 
十 (Ri 一 天 一 下 ji 十 元 ) 十 《Xi 让 一 天 站) (5.42) 


5 Hit 
i=t 


了 


1 
1 
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其 中 


在 一 一 一 2 Xi 为 总 平均 向 量 


I 1 do 
Ea 


ze 一 上 了 > xi 为 在 4 下 的 平均 向 晤 


el] k= 


Rj 5 > Xji 为 在 Bj; 下 的 平均 向 量 


ft j= r=1 


一 > xf 为 在 《418;) 配合 下 的 平均 向 量 


由 于 Ez 一 yy， 所 以 主 反 映 『 了 平均 第 应 ; ElRi. 一 大 中 和 
所 以 证 i. 一 到 反 觅 了 A 的 效应 ; 了 (是 4 一元) 一 房 ， 所 以 元 
一 许 反 里 了 8; 的 效应 : 忆 ( 是 rr 一品 :一 时 5 十 名) 一 4， 记 愉 二; 
一 元 :一 这 十 天 有 反映 了 4 与 Bj 的 交互 作用 雍 应 ;而 ECxi4 一 Xjy-) 
一 和 ,所 以 xi 一 六 反 鼎 了 误 关 。 因 此 我 们 令 


54 一 加 一 第 是 一直 ) 


i=1 


Sa 一 bp3 a (RY 


f= 


Sxp 一 >) > 区 还; 一 一 十 大》 


iol ja 


X (Ky. — Ki — Xj 十 EY 


一 bp3 D3 Cx — Kis Hxiiy — Es) 


dm f= 


吕 一 六 p> 3 《xi 一 (xi 一 


仿照 单 向 分 类 一 样 , 称 54 为 因素 4 的 效应 < 平方 和 短 降 ,5; 为 因 
素 中 的 效应 "平方 和 "和 矩阵 ，Suxs 为 交互 作用 效应 “平方 和 ”矩阵 ， 
34 为 误差 “平方 和 "和 矩阵 , 吕 为 总 离 瘀 “平方 和 拭 阵 ， 
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通过 (5.42) 的 分 解 式 容易 验证 
Os 二 5S 十 $exp 二 5 (C5.43) 
而 Se 和 日 都 是 x 的 二 次 型 。 在 Sa 中 有 六 个 变数 ， 


存在 -一 个 线性 关系 式 了 (3. 一 区) 一 0， 故 它 有 自由 度 吉 一 1， 


类 似 地 53s 有 自由 度 :一 1，5Sxxs 有 自由 度 (m 一 DC 一),5, 
有 自由 度 mrt# 一 1)， 旬 有 自由 度 wr 一 1， 
检验 (5.39)~~《5.41) 的 答 验 统计 二 分别 为 
As— [SLS Sa ~ ACp mstt — 4m™— 1) {5.44) 
Ap—= IS NIST Sp ~ ACpmse — i) —1Y C5.45) 
6 [sl 13, 十 Saxsl 
~ ACpsmitr — Cm — 1 CO— 1)) (C5.46) 
以 上 可 归纳 成 一 个 方差 分 析 表 ( 岩 5.3》, 


表 5.3 吧 向 争 元 方 整 分 析 表 


方差 来 源 离 差 和 矩阵 自 由 度 
固守 4 | 34 一 全 1 C— CR. 2 1 SUS 十 只 41 
因素 日 | Sao DD mi EXE 一 1 Sl /lS 十 Sal 
+ 
， 9 (Fi 一生. 一早。 
闪 百 稚 用 | Ss 
十 素 诈 i 一 天 -一 到 wj 十 要) 
5. 一 Bi Bi A | 
误 EE > 4 "XC 4 mr 一 1) 
[ — Fi 
本 ST Sr — Ex, 一 一 一 一 一 一 
总 和 | 2 人 ss 
一 天》 “ 


若 由 于 实验 条 忻 限 制 ， 在 4 和 了 的 各 水 平 配合 下 只 能 做 一 次 
试验 , 即 总 共 做 ms 次 试验 ,那么 就 无 法 了 解 它们 的 交互 作用 ,此 时 
只 能 考虑 模型 
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6i ~ 入 ,C0, 了 )】 且 相互 独立 在 一 12， 二。 (5.47) 


A 
j= 1,2,--*,7) 


类 似 于 (5.42) 的 分 解 式 为 
Xi 二 证 (Xi 一 对 ) 十 (下 .; 一 寺 ) 
十 《xi 一 元 .一 元 ji 十 二 (5.48Y 
其 中 
时 一 二 并 Zi x 元 .一 工 ?x x 之 xm 
令 
54 一 2 (过. 一 站 )(Zi. 一 于 《自由 度 为 m 一 1) (5.49) 
Se 一 人 AR; 一 至 )(z-; 一 主 》 《自由 度 为 :一 1) 《5.50) 
$5- (xyy 一 元, 一 无) 十 元)Kxil 一 元 :一 元 | 十 计 》 
自由 度 为 Cm 一 1)Cs 一 1)) (5.51) 
9 一 xn 一 有 xi 一 zx》 《自由 魔 为 mr 一 1) 
通过 分 解 式 (5.48), 容 易 验 证 


全 一 5 十 3 十 9 《5.527 

此 时 要 检验 的 假设 是 (5.397 和 (5.40)。 检 验 的 绕 计 量 为 
-|S + Sl ~ ACp Cm Oo— 1 — Dm Oo 1) {5.53) 
= | |i|S + Sa) ~ ACp Cm OO— Ns O— 1),5 — 1) (5.54) 
光 中 ‘$008, 和 8 为 (5.49)~(5.51) 所 确定 。 类 似 地 ， 可 列 成 一 个 

双向 无 交互 作用 的 多 元 方差 分 析 表 。 

例 5.3 我 们 把 四 个 不 同 的 谷 种 随机 分 成 四 个 组 在 20 块 土地 
上 按 五 种 不 同 的 种 种 方式 进行 培育 《 见 不 向 的 肥料 用 量 和 不 同 的 
田间 管理 措施 》, 在 移植 后 六 个 昌 期 对 二 个 指标 进行 测量 ， 一 个 是 
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植株 的 高 启 x,, 另 一 个 是 杆 陈 的 分 药 数 mm， 表 5.4 给 出 了 有 关 的 
数据 。 我 们 希望 了 解 不 同 的 品种 和 不 同 的 种 植 方式 对 两 个 指标 是 
否 有 显著 影响 。 这 正 是 双向 的 多 元 方差 分 析 问 题 。 由 表 5.4 的 数 
据 知 道 不 同 品 种 和 不 同和 的 种 植 方式 的 各 种 配合 只 收 了 一 次 试验 ， 
故 不 考虑 交互 作用 ， 按 模型 (5.47) 进 行 处 理 。 由 表 (5.4) 中 的 数据 
及 (5.49)~(5.51) 计 算得 

54 一 《24 3) 《自由 度 为 m 一 1 一 3) 


31.7 —0.5 
—0.3 1.0 


) 《自由 度 为 ， 一 工 一 4 
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157.4 一 14.9 
:一 (ys 1 《自由 度 为 (mw 一 1G 一 1) 一 12) 
354.2 


一 了 
“。 2s】《 自 由 度 为 m; 一 1 一 19) 


-s+ss+s,—( 


检验 品种 对 两 个 指标 是 否 有 显著 影响 , 则 要 检验 
fH: Hy: 天 不 全 为 
由 统计 量 (5.53) 计 算得 
一 181 二 34 一 134【44 ~ AC2,12,3)) 
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由 第 三 章 表 3.1 知 


1. 1—VAs ~ : 
F 了 Vi P(t6,.22) 
并 由 47 一 034 计算 得 已 一 2.62。 查 得 临界 值 F,9(§,22) 一 
2.55， 显 然 F > 2.55， 改 拒绝 玉 ,， 即 认为 品种 对 两 项 指标 有 显 
著 影 响 ， - 
检验 种 三 方式 对 两 项 指标 是 和 否 有 星 著 彩 响 , 色 要 检验 
Hz: BB 0 Ho: 不 全 为 0 
让 统计 量 (5.54) 计 算得 
一.113 二 3 一 0.778 《8 ~ 4f2,12，477 
而 <。 


Fali.l—VAs ~ p(s,22) 
4 As 
并 由 4z 一 0.778 计算 得 FF 一 0.367， 临界 值 为 Fat8,22) 一 
3.45 显然 FF < 3.45。 故 不 能 拒绝 万 ,,, 见 各 种 种 补 方 式 无 显著 其 
异 。 


习 题 六 
6.1 设 有 参 元 正 态 线性 回归 旋 型 和 ~ No 和 2。z% 1,》 试 用 微分 法 求 
出 引 的 极 大 似 然 估计 必定 清 足 正规 方程 
XZ = (22 
[提示 : 令 LC8) 是 似 然 务 数 ,由 4LC8) 一 0 可 得 出 正规 方程 ] 
5.2 ”对 于 多 元 线性 问 归 神 型 一 62 + se， 证 明 吕 的 1L3 佑 计 站 具有 
这 下 性 质 ， 
钱 使 广义 方差 [CX 一 ZX 一 982)'| 达到 最 小 
团 在 矩阵 非 负 定 意 义 下 :对 于 性 间 日 成 立 
(KX— zx — 2) — OI — OF) 
图 十 得 (X 一 62)(X 一 82)' 的 迹 达 到 最 小 。 
.3 设 XN BZ, ET ) (Ca?) {ZT>0), 上 且 rk2 一 对 十 下， 其 px 
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随机 第 阵 ，ey xs+ 回归 套数 矩阵 ，2444wyxe 设计 笨 阵 。 设 所 是 (9 + 的 X 
《ea + 1) 阶 非 奇 矩 阵 * 且 市 一 GZ， 刚 新 的 回归 秦 数 矩阵 为 了 一 DG、 从 
而 XX 一 Np,aT* WW 三 ,1.)。 证 明 : 
加 车 台 是 8 的 极 大 伺 热 估计 , 则 的 极 大 僻 然 舍 计 是 FF = 60" 
AwWW'P' = (ZZ2) 闪 ' ,从 而 (级 大 似 然 告 计 ) 不 变 。 
国 户 与 全 相互 独立 ， 
图 站 一 WaifT ,2,0 C22)7 67), 
6.4 设 多 元 正 态 线性 钵 型 XX 一 Ny, .982,25,1.). 
其 中 Bu mm (C813 6), Zoe = (2") 98, 和 6, 剖 是 px 4 阶 短 阵 2, 
都 是 4 x « 阶 矩 阵 、 写 出 检验 杭 设 可 :9: 一 日;,，H: 台 , 半 日 ， 的 似 然 比 检 
验 统 计量 ， 
6.5 为 了 建立 地 面 坐 未 《zy) 和 卫星 扫描 图 誉 标 tw; *)》 的 变换 公 
式 ; 我 们 采用 多 元 线性 回归 模型 建立 公式 (加 归 方 程 } 
f = 
Fo By + Bis + By, 
现 测定 了 9 个 义 制 总 ,数据 如 下 


B717 | B70 92.75 


和 .00 于.70 65.20 


钱 求 出 回归 参数 矩阵 : 8 一 (人 Bn Bs 
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册 对 qq = 0.05。 检 验 s37 对 **” 有 无 显著 影响 ? 

为 于 新 的 坐标 x。 ?0 一 《86，58) 。 预测 其 相 点 的 扫 括 画 的 从 入， 
求 出 (wotsr) 的 0.95 置信 棋 网 。 

4.6 对 三 种 不 同 的 处 理 方式 重复 进行 试验 。 分 别 观察 了 欲 考察 的 两 个 
指标 的 信和 如 下 : 


wn (1), (7) (1 (4) 0) 
na (2) (1). () 
sa 


名 报 蚀 单 向 分 类 多 元 方差 分 折衷 进行 计算 。 

仿 计算 检验 统计 量 4 的 入 ,并 分 唱 利 用 sr 分 布 以 及 渐 近 的 央 分 布 对 检 
难处 理 萄 应 是 否 相 等 《e = 0.01) 进行 推断 :并 比较 丁 老 结论 是 否 一 致 ， 

6.7 ”要 比较 5 个 品种 大 考 产 量 , 用 连续 二 年 的 单产 量 x = 《rsiy 作 
为 落 查 指标 , 在 三 个 不 同 地 区 的 产量 作为 三 次 重复 ,其 资料 如 下 : 


笃 


了 0 于 

( 2) 
142 Lt5t 
Go) | 人 
121 124 
(2) | (9) 

外 对 于 a = 0.05， 检 验 各 品种 之 间 的 产量 是 否 有 显著 差异 。 
* 国 对 于 a 一 0.05， 给 出 品种 4 和 品种 4 的 均 信 向 量 差 的 同时 置信 

区 间 。 


6.8， 仍 利 用 第 七 题 的 资料 ， 而 把 三 个 不 同 的 地 区 视 为 因素 3 的 三 个 水 
平 , 报 据 双 向 分 区 (无 交互 作用 ) 多 元 方 莹 分 析 考 虑 


( 
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中 对 于 “一 0.05， 检验 各 品种 之 间 产 最 是 否 有 显著 差异 s 守 与 第 七 愿 
结论 加 以 比较 ， 

图 对 于 = 一 0.05， 检 验 不 同 地 区 的 产量 有 人 否 显 著 差 异 。 

f.9 用 调 优 运算 法 寻找 塑料 胶卷 的 最 优 工艺 条 侍 ， 考查 三 个 指标 :x 一 
耐 据 力 ，。z, 盖 光泽 ，” = 不 透明 度 , 过 虑 两 个 因素 4 = 拉 速 , 引 一 举 加 剂 
的 车 ,每 个 因素 取 两 个 水 平 :对 每 种 因素 组 人 台 做 5 次 试验 ,其 数据 如 下 : 


本 也 ( 低 县 》 


| Gd G2 58 6.5V 16.5 
及 , (低速 四 [中 器 国 | (4 图 
En 4 A 0 Wl) 0.8 
x GT GG fa Tl 16:8 
有 4 (高速 》 品 [a 加 [中 人 图 
En 2.8 Ml 3B) M6) N34 


-一 一 一 一 一 


卸 标 值 8B: 《高 量 》 


6.9 7.2 16.N 16.1 f6.3 
全 【低速 > 四 a 器 [ 吕 团 
5.7 2.0 M3 i-9/ \3.7 
7.1 7.0 “7.2 了 -5 7.6 
者 {高速 ) 加 | (|) [中 [a 图 
BA) 人 -2 \é.9 2 9. 
给 定 < 一 0.0 呈 ， 试 检验 因素 4、8， 及 4 x 8B 对 试验 结果 是 吾 有 显著 
影响 。 . 
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第 七 这 浏 别 分 析 


判别 分 析 是 根据 所 研究 的 个 体 的 观测 指标 来 推 钙 该 个 体 记 属 
类 型 的 一 种 统计 方法 。 在 自然 科学 和 社会 科学 的 研究 中 经 常会 磁 
到 这 种 绪 计 问题 。 便 如 在 地 质 找 入 中 我 们 要 和 根 担 某 蜡 常 点 的 地 质 
结构 、 化 探 和 物探 的 各 项 指标 来 羯 断 该 异常 点 属于 哪 一 种 矿 化 类 
型 ; 医生 要 根据 某 人 的 各 项 化 验 指标 的 结果 来 判断 该 人 属于 什么 
病症 ;调查 了 某 地 区 的 土地 生产 率 、 劳 动 生产 率 、 人 均 收 入 、 费 用 水 
平 ， 农 村 工业 比重 等 指标 ， 要 确定 该 地 区 属于 吨 一 种 经 济 类 型 地 
区 . 
章 册 问题 用 统计 的 语言 来 表达 ,就 是 已 有 了 个 总 体 mym …， 
es 它们 的 分 布 葬 数 务 别 为 F.Cx)， Fx), -+ Fx), 每 个 
F,(x) 者 是 了 维 测 数 。 对 于 一 个 新 给 定 的 样品 x, 我 们 要 判断 它 
是 来 自 志 一 个 总 体 ， 当 然 ， 我 们 应 该 要 求 判别 准则 在 基 种 韶 义 下 
是 最 优 的 ， 例 如 错 判 的 概率 最 小 或 错 判 的 损失 最 小 等 。 本 章 仅 介 
绍 最 基本 的 几 种 判别 方法 , 即 距离 判 别 ，Bayes 判别 和 Fisher 判 
别 。 


$7.1 距离 判别 


{一 ) 统计 距离 

在 判 鲁 分 析 中 以 及 第 八 章 的 聚 类 分 析 中 都 要 涉及 到 样品 之 
间 、 样 总 与 总 体 之 间 这 及 总 体 之 间 的 距离 。 因 此 我 们 对 距离 作 一 
些 简单 介绍 . | 

定 站 11 设 字 基点 集 ,dl(,") 是 名 x 和 多 到 [0,cc) 的 函 
数 , 对 于 鳃 中 的 任意 点 xjyXi 和 2， 车 d(x;xi)《 简 记 为 上 业 ;) 满 
足 : 

6 dj 沪 0， 当 且 仅 当 一 %i 时 取 等 号 s 
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(EH) di ™— diis 
GY 而 过 di 十 dy 《三 角 不 等 式 ). 
则 称 2 为 点 ;与 x 的 距离 。 
请 足 上 述 定 尽 的 而 有 多 种 ,下 面 列举 一 些 常 用 的 距离 。 
1°. 明 考 夫 斯 基 臣 离 ( 简 称 明 氏 蝶 离 》 


diCm) 一 这 一 = | ,>。 (1.1) 


当 六 一 1,2, 00 时 分 别 得 到 绝对 距离 、 欧 氏 距 离 和 苇 比 才 夫 耻 
离 ; | 


加 


. 

ditl} 一 >) | *w 一 xui| (1.2) 
a=t 

dii(2) 一 b> 《su 一 za (1.3) 

di oo) 一 1 x 一 Xo | (1.4) 


如 果 * 的 各 个 分 量 的 测量 值 悬殊 很 大 ,采用 跟 民 距离 是 不 合理 的 ， 
此 时 可 以 对 数据 先 标准 化 或 极 差 化 处 理 后 再 来 计算 距离 。 
2°. 8 模 距 离 ， 
对 于 和 任 给 定 的 正定 气 阵 8, 由 
di [Cx xy Bx — x (1.5) 
算出 的 距离 称 为 x 与 x 的 B 卉 距离 . 
设 任 意 点 x; (随机 向 量 ) 的 六 个 分 量 的 方差 存在 记 为 02, Ca 一 
1,*…,p) 击 它 们 的 数学 期 望 向 量 和 协 方 差 阵 分 别 为 p=-ECxi)， 
王 一 cov(Cxzi) (加之 0) 了 时， 那么 当 BB 一 ! 时 人 恒 得 到 了 著名 的 
Mahalanobia 距离 (简称 马 民 距离 ): 
而 一 [re 一 zx — xi)]¥ 《167) 
读者 可 以 验证 蕊 氏 下 宛 具 有 平移 不 变性 和 非 奇异 变换 下 的 不 变 
性 . 


当 一 diag{ 上 ， -- 二) 时 , 便 得 到 了 方差 加 权 距 离 ; 
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人 Cr (1.7) 


当 瑟 一 了 (单位 阵 ) 时 ， 了 楼 踢 喜 盾 是 C1 3) 式 的 网 区 中 高 

当 点 的 各 个 分 量 对 区 分 样品 有 不 辐 的 作用 时 。 可 给 各 分 最 不 
同 的 权重 ; 例如 第 gs 个 分 嫩 赋 于 权重 .此 时 BB 可 取 为 
diag(5,，-…， 5p)， 我 们 可 以 粗 临 地 说 8 的 主 对 和 角 线 元 素 56 表示 
第 4 个 分 在 区 别 样品 时 所 占 的 权 量 , 非 对 角 线 元 察 bs 表示 第 = 
个 分 量 与 第 8 个 分 量 的 交互 作用 在 区 分 样品 时 所 占 权 重 的 一 半 。 

(二 》 两 总 体 的 情况 

设 有 两 个 具有 相同 协 方 差 钾 2(3 之 > 0) 的 总 体 re 它们 
均值 向 量 分 别 为 pg 中 ,pg ， 对 于 一 个 新 给 定 的 样 山 :要 判断 它 是 
来 自 于 哪 一 个 总 体 ( 或 老 说 要 判断 它 属于 哪 一 个 总 体 )。 一 个 最 直 
观 的 想法 是 分 别 计算 x 与 两 个 总 体 的 距离 〔 点 兰 到 pm 的 距离 称 
为 点 x 到 总 体 = 的 距离 》dCx ,he)，; 一 1,2。 然 后 根据 下 列 规 
则 进行 判别 

f E wl 当 . dx RD SE dx) C1.8) 
KXE A 当 dCx, pt) > dx?) 

《 当 扩 x ,9) 一 Ax Ra 时 ,x 可 归属 于 坝 , x 的 任何 一 个 
为 了 方便 叙述 不 妨 将 它 妇 属 x1)、 在 这 里 我 们 采用 马 氏 距离 。 为 
了 条 化 (1.8), 计 算 两 个 马 氏 距离 平方 之 差 

d(x) d(x ) 一 Cx 一 PIYE Cx oo 可) 

— (x pI Ex 一 有 
一 -一 2fx 一 (pa 2 Ep 一 py) 


一 一 2 了 rdx7) 
其 中 
本 (xz = Cx — RYE Cp 一 相 的 (1.9) 
一 二 (p+) 
于 是 在 马 氏 距离 之 下 规则 (1.8) 变 为 
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下 当 Wix) > 0 (1.10) 
XEn 当 W(x)<0 
W(x) 是 x 的 - -个 线性 函数 ,一 般 将 下 (xz) 称 为 线 覆 判别 沙 
数 ,显然 二 维 平 面 玉 (x)》 一 0, 它 把 思维 空间 分 成 两 部 分 , 即 得 到 
? 维 空间 一 个 划分 : 
KK, = {x: Wix) > 0} 
Rs— {x:W(xX) < 0 
当 样 品 x 《 Ri 时 ,两 判断 x em， 当 x 《Ri， 则 判断 x x， 当 
我 们 引 人 和 人 总体 先 验 概 率 .、 错 浏 损失 等 概念 后 ,如 何 寻 找 一 个 使 平 询 
锚 判 损失 达到 最 小 的 划分 问题 我 们 将 在 下 一 节 的 Bayes 判 别 中 
来 讨论 。 对 于 上 述 判 型 规则 41.10) 作 用 点 说明 ， 它 对 于 我 们 理解 
判 员 分 析 很 重要 . 
1” 按 最 小 距离 规划 判别 是 会 产生 误 关 的 ;为 了 说 明 问 题 ,不 
妨 设 p= lH 为 NE’), ry 为 Neo) 《te > Fe) 由 图 
1.1 中 可 以 看 到 当 * 事实 上 取 自 mm 但 它 的 观察 值 趣 落 在 -一 


二 Ga 十 m) 的 右边 ， 按 上 述 的 规则 应 把 = 判断 为 二, 此 时 发 生 


误 刊 , 滔 判 的 概率 正 是 图 中 的 阴影 部 分 的 面积 ， 另 外 判别 电 ( 或 称 、 
疝 值 ;的 选取 是 很 重要 的 ,如 果 不 风 严 为 判别 限 ， 而 以 另 一 后生 为 
判别 限 , 这 时 将 = 误 判 为 x 的 概率 减 小 了 ， 但 xz 误 判 为 的 概 
亭 却 增 大 了 ，。 对 于 正 态 总 体 我 们 可 直接 验证 最 小 距离 判别 的 判别 
跟 声 保证 了 这 两 个 误 判 概率 痢 同 ， 


上 £ 上 


2” 从 图 1.1 可 看 出 , 当 两 个 总 体 mw 十 分 接近 时 , 则 无 论 
用 什么 办 法 , 误 判 概率 都 很 大 ,这 时 判别 是 没有 意义 的 ， 因 此 在 判 
别 之 前 应 对 两 总 体 的 均值 是 否 有 显著 差异 进行 检验 ， 

3” 由 于 落 在 丘 附 近 的 点 误 判 概率 比较 大 ， 有 时 可 划 出 一 个 


待 判 区 域 ,例如 取 [evd1 -| 一 二 lw 一 ma+ 二 le 一 站 


作为 待 郑 区域 ,这 样 就 有 
必 xl 涩 IE 


LER 当 x2d 
| 待 判 ed 

4” 以 上 判别 函数 及 规 则 并 没有 涉及 划 具 体 的 分 布 类 型 ,只 
要 二 阶 伟 存在 就 可 以 了 . 

知 果 两 总 条 的 绝 估 向量 及 公共 协 方 关 阵 未 知 时 ， 可 如 用 本 总 
体 的 祥 术 来 合计 。 设 xz 由 人 一 12 X12 
分 别 是 1 利 | x 的 样本 ， 令 

站 0 一 工 bp XE 1 x 


fH] 了 一 T Hy 一 1 


一 BD (xz 一 Ra)(zg — EO), 
i=1 ， 
4 Dx — Ix — 2 
i 


辫 一 


那 末 判别 函数 可 到 为 
Wix) = | > 一 二 (十 seo)| EE 一 填 (37? (C1.11Y 
判别 的 规则 与 (1.10) 一 样 . 


上 面 讨论 的 是 瑞 总 体 具有 相同 的 公共 协 方 关 阵 的 情况 如 时 
两 总 体 与 严 的 协 方差 阵 马 和 3 不 相等 ,此 时 判别 函数 


2 


W(x) 一 下 (xD — Fx, RD) 
-x — pT a) 
— x MOY Er — pan) (1.12) 
是 * 的 二 次 函数 ,显然 它 比 线性 函数 复 琳 。 
(三 》 条 总 体 的 情况 
设 有 8 个 总 体 zw ,，… ,xe。 它 们 具有 公共 的 正定 协 方 差 阵 和 
不 同 的 均 什 向量 Ap， 一 1，2,… 9。 那么 判别 函数 可 取 为 (这 
里 仍 采 用 马 寺 距离》 


Wi(x) 一 | > 一 六 CPP | Et 一 Ag))， 


外 (1.13) 
此 时 ?了 维 空间 的 划分 {Ri,:…， 民 ,可 如 下 规定 : 除了 边界 点 以 
. 外 ,有 
Rm { :了 xz) > 0, 对 一 切 i i 1,2,..……,g C1.14) 
判别 的 规则 为 : 若 x€ Ri， 网 淹 断 x Ex im 1 2 49。 机 
果 使 得 钱 六 (xz7 一 站 本 i Wit) =0 (lr , 
刘 x 可 判 篇 于 wis 的 任 一 个 ， 即 在 边界 上 的 点 可 判断 
为 得 邻 区 域 的 性 一 个 ， 
类 假 地 , 当 po， 1 一 13， -9， 和 了 都 是 未 知 时 ， 可 用 它 
们 办理 的 信 计 代替 . 设 x 中 是 x 抽取 的 有 人 为 ;的 样本 


Ci do 2, 
人 
509 一 工 XP A;= (XP — RNID 一 ENY 
2 > 


二 3 4, 其 中 4 — Dn,, 
(i 1,2,..-,9) 
相应 的 判别 函数 为 


wx) ~— [x—l Lm 十 £1)] Sa® 一 0 (115) 
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判别 的 规则 如 前 记述。 

上 面 讨论 的 是 4 个 总 体育 公 共 协 方 痊 阵 三 ,如果 个 总 体 的 

协 方差 阵 不 同 ， 设 wi 的 均值 向 量 为 mn, 协 方差 矩阵 为 3; 《3 > 

0), i= 1, 2,."** ,9, 此 时 淹 别 区 域 Ri 一 1,2,.…+,9 比较 复 

杂 ， 在 实用 上 是 直接 去 计算 Jtx ,pn ,i 一 1;2,"'-,9, 将 + 判 
人 距离 最 小 的 哪 一 类 , 控 旺 抠 则 判 哄 区 域 可 写 为 

Ri™= {x:dx, A) 一 min d(x )}, fm 1 2: -9(I16) 


车 到 4 个 总 体 的 最 小 距离 不 止 一 个 , 即 
Ce) 
， - 1 号 本 


则 = 可 归 人 my 的 任何 一 个 。 

例 1.1 生物 统计 学 家 经 常 提出 由 个 体 的 "大小" 及“ 形状” 因 
子 ( 这 就 相当 在 第 妃 章 中 将 要 介绍 的 两 个 主 成 份 ) 来 进行 判别 的 癌 
题 , 用 x 一 (zyx2》 表示 “大 小 "和 "形状" 两 个 因子 。 现 从 正常 人 
和 精神 病 息 者 两 个 总 体 中 各 抽取 了 25 个 测量 了 茶 些 指标 并 变换 
为 "大小" 和“ 形状" 数据, 列 于 表 1.1。 另 外 还 新 测定 了 一 “病员 "的 
“大 小 "和 “因子 ”数据 列 在 该 表 的 最 后 一 行 ， 试 用 最 小 距离 法 判别 
该 "病员 "是否 和 忠 有 精神 病 ， 

从 表 1.1 中 的 数据 计算 得 


bs] 
死人 一 坟 SD xP = (20.80, 12.32Y, 


开 二 1 
5 

元 0 一 世 人 xD — C12.80,36.407 
本 一 上 


1 6.90 —5.27 
号 1 一 一 一 A — ( )， 
24 —5.27 40.89 


1 36.75 13.92 
2 > A 一 ( ) 
13.92 287.92 
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天 1.1 正常 人 和 精神 病 恕 者 的 “天 小 "和 "形状 "数据 


正 常 大 精神 病 息 者 
座 号 mY | ER W*Exy | A) 
1 22 6 62 24 38 
4 30 144 3 在 [9 3 
Ei 13 外 6 11 43 
4 234 ?7 站 560 
5 1? 各 3 9 32 
€ 2 二 9 看 ] 17 
7 23 13 53 3 17 
a 18 1a 18 15 
Ey 22 16 42 1 443 
10 19 18 23 20 有 
11 20 17 3 8 二 
12 20 31 2 20 £2 
13 2 9 51 14 36 
14 13 13 地 村 12 
15 2 14 号 看 | 51 
1 各 19 15 29 22 22 
17 20 T1 二 二 T3 30 
1 1a 17 2 站 30 
19 20 7 sD 20 61 
20 23 6 €7 20 站 3 
21 23 23 33 15 48 
22 25 9 71 5 .53 
23 23 5 69 w 43 
24 2z1 12 45 13 19 
25 2 7 看 了 了 4 

新 病员 | 28 | 3 !: 22 


s 4+ 4 1 (5 1.65) 


站 十 2\865 328.81 


Co 0) 
4.33 164.40 


3 


.302。 


ED RE C8.00, 一 24.0 和 了 


取 壮 的 伴随 矩阵 
(4 33) 
一 4.33 21.83 
则 
3570.1 0 
下 。 了 一 ( 0 ,一 3570.17 CI 为 单位 上 矩阵) 
从 而 . 
fl 164.40 33) 
3570.1 (aa 21.83 
将 上 述 计算 得 的 数据 代 太 线性 判别 函数 C1.9) 得 
一 1. _ _ 
Wix) 3 C1419z, 一 560x: 一 10198) 
280 
人 了 70 CS 一 2x2 一 36Y 
280 加 
570 工 琴 《zx 1) 


显然 证 (xy 关 0 或 者 到 (的 之 0 等 价 于 W*Cx) 呈 5x1 一 24, 一 
36 守 0 或 者 WW*(x) 一 0。 于 是 ,我 们 按 印 *(x) 关 0 判 为 正 党 
和 估 ，y*Cx) 二 0 判 为 精神 病 串 者 ， 当 我 们 用 不 数据 进行 回 判 时 ， 
25 个 正常 人 的 数据 代入 Wx》 后 全 部 大 于 0, 而 25 个 精神 病 - 
患者 代 人 后 有 4 个 大 于 0。 误 判 率 为 8 锡 。 把 新 测定 的 “病员 ” 数 
据 代 人 后 得 WY 尺 x) 一 22 > 0， 故 该 “病员 ”应 判 为 正常 人 。 


| 572 Bayes 列 别 
(一 ) 误 判 概率 与 误 判 损失 
关于 误 判 概率 的 概念 在 上 一 节 中 已 谈 过 . 设 有 两 个 总 体 和 


= 根据 某 一 个 判别 规则 . 将 实际 上 为 ww 的 个 体 判 为 ww 或 者 将 实 
际 上 为 的 个 体 判 为 二 的 概率 就 是 误 刊 概 雍 ,一 个 好 的 判别 规则 
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应 该 是 使 误 判 概率 最 小 。 除 此 之 外 还 有 一 个 误 判 损失 问题 或 者 说 
误 判 产生 的 花费 《ecost) 问题 , 如 把 a 的 个 体 误 判 到 x 的 损失 比 
x 的 个 体 误 判 到 x 严重 得 多 , 则 人 们 在 作 前 一 种 判断 时 就 要 特别 
诞 愤 ， 辟 如 在 药品 检验 中 把 有 于 的 个 体 判 为 无 吾 的 其 后 果 比 无 毒 
个 休 判 为 有 毒 的 严重 得 多 ， 因 此 一 个 好 的 判别 规则 还 必须 使 得 误 
判 损失 最 小 。 
为 了 说 硼 问 题 ， 我 们 仍 以 两 个 总 体 的 情况 来 讨论 ， 设 所 考虑 
的 两 个 总 体 x 与 x 分 别 具 有 密度 函数 jx) 与 h(x), 其 中 x 
为 了 维 向 量 。 记 口 为 所 有 可 能 观测 值 x 的 全 体 , 称 它 为 样本 空间 ， 
R, 为 入 据 我 们 的 规则 要 判 为 x 的 那些 x 的 全 体 ,而 Ri 一 2 一 RR, 
是 楼 判 为 w 的 那些 x 的 全 体 。 显 然 Ri 与 R, 互 太 完备 。 某 个 体 
实际 是 来 自 x, 但 被 判 为 坊 的 概率 为 
PQID = PlxeE Rr) 一 人 Redx 2.1) 


Ry 


来 自 bd 被 关 为 II 的 概率 为 
PGI/D ™ PlxE Rm) 一 二 fx)dx (2.2) 、 

类 似 地 ,来 自 屏 被 判 为 mm 以 及 来 自 x 被 判 为 mm 的 峰 率 分 别 鸭 
PO/2) 一 PCxe Rss) 一 | | flxYdx (2.3) 


Rr 


PC2f2) = Px € Rlrs) — [ . | f(x)dx (2.4) 


叉 设 pL 和 力 分 别 表示 总 体 x 和 和 的 先 验 概 率 ， 且 Pi 十 记 
一 1。 于 是 
P (正确 地 判 为 和 一 了 (来自 太 , 被 判 为 ) 

— Plx€E Rn)° Plm)™ PCA) «hp, (2.5) 
P 误 判 到 ww%) 一 下 《 来 自 <, 但 判 为 于) 
一 Plx€ Rr)* Pr) — PU/2) :hh (2.6) 
类 似 地 有 


» 30F* 


P (正确 地 判 为 ra) 一 了 (212)， p C2.7) 
P ( 误 尘 到 =) 一 PC2/ 41)p (2.8) 
设 CL1/2) 表示 来 自 za 误 判 为 ww 引起 的 损失 ，C(211)》 表 
东 来 自 x 误 判 为 x 引起 的 损失 ,并 规定 CU 已 一 CC212) 一 0 
将 上 述 的 误 判 概率 与 误 潭 损失 结合 起 来 定义 一 个 平均 误 羯 损 
失 《expected cost of misclassification》 并 记 为 ECM. 
下 CMR RY) 一 CC2117PC2AtDt + COII2YPCOL 2p, C2.9} 
一 个 合理 的 判别 规则 应 使 ECM 达到 极 小 。 
对 于 (297 式 可 以 推广 到 4 个 总 体 的 情况 ， 设 了 个 总 体 zi， 
i 一 1,2,…、 4 的 密度 函数 为 j(x)， 先 验 概 率 为 pi, i 一 112,…， 
4。 用 CC 表示 实际 上 来 自 ww; 的 个 体 误 判 到 <x 产生 的 损失 
(1 一 12， 9。 约定 C(i 门 下 0。 又 设 有 是 根据 规则 判 
为 xx 的 那些 x 组 成 的 人 案 合 , 且 Ri 互 斥 完备 . 疡 (和 /全 一 下 (XE Ri 
= — | Fd, Gk, ge YR PU/ 1 


~ PD., 
Es} 
来 自 x; 的 个 体 被 误 判 的 平均 损失 为 
ECM(R) 一作 | POADCOKID 一 1 2 


st 


于 是 总 的 平均 误 判 损失 为 
ECMCR :+ RO) 一 | 六 PCkaCCU] (2.10) 
1 


(2.10) 式 便 是 C2.9) 式 在 多 总 体 情况 下 的 推广 。 因 此 ，、 对 于 多 总 体 
情况 一 个 合理 的 判别 规则 应 使 (2.10) 达 到 极 小 。 

(二 》 两 总 全 的 Bayes 判别 规则 

由 (一) 中 的 叙述 知道 ， 我 们 要 选择 样本 空间 日 的 一 个 划分 : 
Ri 各 RR; 一 全 一 R， 使 得 平均 损失 (2.9) 式 达到 极 小 
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定理 2.1 极 小 化 平均 损失 C2.9) 的 区 域 R, 和 RR 为; 


_{ , fCx) CAI2Y ,Ps 

这 > ce 2 1 
= _ fx) C1/2) .Pp: 

™ 让 : fCx) ~ C11) | 2.12) 


( 当 天 xy/ 天 Cx) 一 CC112) :pf CC211) :pi 时 ， 即 x 为 边界 点 ， 
它 可 归 人 Ri,R 的 任何 一 个 ,为 了 方便 就 将 它 归 人 R)) 
证 明 将 P(2/1) 一 1 eu， 及 


ER: 


PK172) 一 | fCx)dx 


坡 | 


代入 (2.9) 式 得 


ECMCR，R:) — CC211) » pr -| hx)ax 


Ry 
+ CC :ps 7 h(x)ax 
注意 到 | 
人 Da 一 人 Di 二 Da 一 1 


a Rl) Rr 


有 
ECMCR,, Ry) 一 人 [CC1122b,fa(x) 
— CC ph Cx) Yadx 十 CO) 1)p, 
要 使 ECM 达到 极 小 , 仅 当 R, 中 包含 的 点 * 满足 不 等 式 
Cf2)psh x) 一 COP fx) SE 0 
这 样 使 证 明了 (C2.11) 式 ， 耐 样 也 可 证 明 C2.12) 式 . 几 
由 上 述 定理 我 们 便 得 到 两 总 体 的 Bayes 判别 视 则 ; 
+ 306 + : 


EP 


x e122Y 
[~ 当 * 使 得 fe > rer, 和 Ca 
fx) CCLA2) 名 
Em 当 * 合 得 所 2 了 < 区 57 
应 用 此 规则 时 仅仅 点 要 计算 : 
iD 新 样品 点 x, 一 (za,… s,s》 的 密度 函数 比 fx)/hCx0); 
这 ) 损失 比 CO 12 C0211); 
iiiy 先 验 焙 率 比 p/pi. 
损失 和 先 验 概率 以 比值 的 形式 出 现 是 很 重要 的 ， 因 为 确定 两 
种 损失 的 比值 (或 两 总 体 的 先 验 概率 的 比值 ) 往 往 比 确定 损失 本 身 
《或 先 验 概率 本 身 ) 来 得 容易 。 下 面 列 举 (2.13) 的 三 种 特殊 情况 
) 当 p/P 一 1 时 
C1/2) 
Ex -et > CC271) 


(2,14) 
XE 当 zz 使 得 < So 
ii) 当 CQ/2)1CC211) 一 1 时 
下 Em 当 x 使 得 Cx)/j(x) 之 pi (2.15) 
XEx 当 # 使 得 所 XRD 到 有 /证 
iii) 当 ps/ 一 CIA2)ACC211) 一 1 时 
f € mi 当 x 使 得 fCx)/f(x) 之 1 (2.16) 
xEm 当 * 使 得 jCx)/jtx) 二 1 


对 于 具体 问题 , 如 果 先 验 概 率 或 者 其 比值 都 是 难于 确定, 此 时 
就 利用 规则 (2147 ,同样 如 误 判 损失 或 者 其 比值 都 是 难以 确定 , 此 
时 就 利用 规则 (2.1527， 如 果 上 述 两 者 都 难以 确定 则 利用 规则 
《2.16), 最 后 这 种 情况 是 一 种 无 可 索 何 的 办 法 ,当然 判别 也 变 得 很 
简单 : 若 jey 守 fx》 则 判 x & zy， 否则 判 . x € 轴 。 
. 我 们 将 -F 述 的 两 总 体 Bayes 判别 应 用 于 正 访 总 体 Wis 
Nop ,21) (i 一 1,2)， 分 两 种 情况 讨论 ， 
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1l®, B= Bl ~ BF > 0) 
此 时 xi 的 密度 隐 数 为 
Hx) = G25) Bl doxp{— LT Cx — pH) Ex — pn)) 
C2.17) 
定理 2.2 设 总 体 阅 为 wp 3) (i 一 1,2) 其 中 了 0 
让 使 得 平均 说 判 损失 航 小 的 划 分 为 - 


人 一 {x:W(xX) 守 让 (2.18) 
及: 一 {x.Wtx) < Pp} (C2.19) 
其 中 
W(x) 一 | 区 -一 半 《Pen 十 we)| Siu — np (2.20) 
= In ctl/ Pp , 2.21 
“一 ”ccz119 vp (2 


证 明 : 将 密度 函数 (2.17) 分 别 代入 (2.11) 与 (2.12) 得 
R| 一 | 着 ， co|- 四 《一 了 一 FE) 


1 sm ~ C(I/2)p 
+ 二 (x 一 May 2-x 一 pa)] > CA 1 /9 
R,= { Xx: ep| 一 半 (x 一 HY Ex 一 2°) 


| 十 (x 一 有 了 三 Cx -一 zeo)| < ee 


C2 Dp 
注意 到 指数 函数 的 单调 性 焉 及 等 式 
re 村 (一 HT) Ex __ 有 人 ) 


十 地 (x — RYE — pn) 
mi jx — 六 CR 十 ee) 2 Cp _ PC) 
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这 样 便 得 到 C2.18) 和 (2.19) 罩 

不 难 发 现 (2.20) 式 的 下 (x) 与 上 节 最 小 距离 判别 的 线 乌 状 
别 函 数 (1. 史 是 一 致 的 。 判 别 规 则 也 仅 只 是 判别 限 不 一 杆 ， 一 个 是 
p， 一 个 是 4。 如果 当 CC172)27CCC271)5) 一 1 时 ,两 者 就 完全 
一 致 。 

如 果 总 体 的 pp 及 未 知 , 与 以 往 一 样 。 用 总 体 的 样本 


算出 RE 和 5 一 一 一 一 (4 十 41) 来 代 车 ac 和 
1 十 拓 一 2 


2 了， 这 样 判 别 函数 (2.20) 可 写 为 
W(e) 一 | > 一 二 Ceo 二 9) STR — BH) (2.22) 


我 们 把 C2.22) 丈 为 Anderscn 线性 判别 函数 ， 判 别 的 规则 为 
人 当 x 和 佳 得 Wlx} 守 8 
XE A, 当 x 使 得 WCX)<8 
其 中 为 (2.21) 所 规定 ， 
这 里 应 该 指出 ,总 体 参数 下 其 估计 来 代替 ,所 得 到 的 损 则 ， 仅 
仅 只 是 最 优 〈 在 平均 误 判 损失 达到 极 小 的 意义 下 ) 规则 的 一 个 估 
计 , 这 时 对 于 一 个 具体 问题 来 讲 , 我 们 并 没有 把 握 说 所 得 到 的 规则 
能 够 使 平均 误 判 损失 达到 最 小 ,但 当 样 本 的 容量 充分 大 时 ， 售 计 
下 0, 至 外 ,5 分 别 和 Ra 、 3 很 接近 ， 因 此 我 们 有 理由 认为 “ 桩 
本 ”判别 规则 的 性 质 会 很 好 的 ， 
2° S13; CE > 0, 2 > 0),. . 
由 于 误 判 损失 航 小 化 的 划分 依赖 于 密度 函数 之 比 E(x /h(x) 
或 等 价 于 它 的 对 数 ”ln (fCx)/f(x))， 把 协 方 差 和 矩阵 不 等 的 两 个 
多 元 正 恋 密度 代入 这 个 比 后 ,包含 131|3, (i 一 1,2》 的 因子 不 能 


(2.23) 


、 消 去 , 而 且 大 xz) 的 指数 部 分 也 不 能 组 合成 简单 表达 式 。 因 此 对 


于 吾 半 2 时 ,由 《21 和 (12) 可 得 知 别 区 域 : 
让 — {x:W*(x) > K} 
IR {x:W*(x) < K} 
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其 中 
W*(xX) 一 一 pkey — SriOx + (ppY Er! pr E71)x 


(2.24) 
1 CCI2 Np 号 
K In (Sen) 二 了 33| ) 
十 二 《RD' ET 一 a Er) (2.25) 


显然 ,判别 函数 忆 X《x) 是 二 次 函数 ， 它 比 2 一 3 时 的 情况 复 

杂 得 多 。 如 果 pgp 中 ,Zi 一 1,2》 未 知 , 仍 可 采用 其 估计 来 代 堆 。 
例 3.1 表 2.1 是 某 气象 站 预报 有 无 春 旱 的 实际 资料 ,x 与 

xz 都 是 综合 预报 因子 《气象 合 义 从 略 )， 有 春 旱 的 十 6 个 年 份 的 


资料 ,无 春 旱 的 是 8 个 年 份 的 资料 ， 它 们 的 先 验 概率 分 别 用 和 


二 来 估计 ,并 设 误 判 损 兴 相等 , 试 建立 Anderson 线性 判别 函数 。 


表 2.1 某 气 象 站 际 报 有 无 春 早 的 袜 科 


序 号 1 2 | 5 6 7 8 
24.8 | 24.1 | 26.6 323.5 | 25.5 | 27.4 | 
避 EF 2 a4 sol ns ailsl | 
1 Wixis*) 6 .86 |6.907 |7.790 |6,527*|7.100 [8.029 
天 Pl 区 21.6 | 22. 人 | 22.8 | 22.7 | 21.5 | 22.1 21.4 
奉 Fs 一 和 .7 了 | 一 和 .4 08 | 一 上 | 一 1.5 | 一 1.0 | 一 1.2 | ~1.3 
部 WEx ss1) .835 [Ss.647 G6.217 I6.146 19.622 /5.861 


出 表 2.1 中 的 数据 计算 得 
ED ee 25.32,—2.42Y, FH (22.03,—1.19y 


FD RD 329, —1.23Y, 
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了 《过 FP] 一 【23.68， 一 1.81 了 


s ( 2.220 0640) (2270 0.007 ) 
1 0640 02700 ”0007 0.1070 
1.08 —0.26 
s— (55+75)—( ) 
.12 一 026 0.17 


ot 1 Co 026) 
0.116 ‘0.26 1.08/" 
p= nt — i 一 0.288 


， P . 
将 上 述 计 算 结 果 代 人 (2， 22) 式 得 Anderson 线 竹 判别 函数 : 


二 《0.2395x| 一 0.4730x; — €.527) 
为 了 计算 和 验证 方便 取 和 判别 硝 数 为 
Wry 一 本 (ro 一 0.2395x| — 1.4730x, 


取 判 别 限 为 


6.527 + | 
0.116 


将 表 2.1 的 数据 代 人 斑 tx》 进行 回报 , 计算 的 结果 填 在 表 2.1 中 
证 (ms)》 相应 的 栏 且 中 ,到 报 中 错 报 的 只 有 一 个 ， 即 春 旱 中 的 第 
4 号 ,与 历史 资料 的 拟人 台 率 达 93%， 

(三 ) 多 个 总 体 的 Bayea 判别 规则 

在 (一 ) 的 讨论 中 已 知道 ， 对于? 个 总 体 的 情况 平均 误 判 损失 
为 (2.10) 式 , 即 


ECM(R,,.:.,R)— > | 5 Peas Det/ | 


X 0.288 =m 6.560 


我 们 要 寻找 一 个 已 斥 完 备 的 区 域 R ,六 。 使 它 达 到 最 小 。 
AKC] 呈 总 mx， CR (2.26) 
=! 


* 1» 


其 中 f(x) 为 第 守 个 总 体 x; 的 密度 函数 。 对 于 满足 
hi ) 


nxy) =— mn, 
的 样 坟 空间 虽 中 的 样品 点 * 组 成 的 集合 
点 革 有 rl 之 + 所 9) 个 标号 广 :- 
Bx) 


那么 我 们 视 定 该 x 可 当代 侣 Ra 
就 可 将 只 划分 为 豆 斥 完备 的 区 域 RI,…- 


划分 。 
定理 2.3 Bayes 唱 分 玉 
达到 极 小 。 


+ 二 aC 一 min 
工 噬 是 喇 字 


(2.27) 
记 汶 只 ;, 如 果 窒 某 个 样品 


全 得 C2.27) 式 成 立 , 即 


BiCx) (2.28) 


,Ri 中 的 任何 一 个 。 这 样 
, 尺 ,。 称 此 划分 汐 Bayes 


,RR。 使 得 平均 误 淹 损失 (2.10) 


证 明 由 于 PCG1D 一 全 fax, 再 根据 (C2.10) 及 (C2.26) 


‘RD = 六 名 > POCORNCCRII) 


-Dp 2 CC&ID | ~ Kx)ax 


RY} 


ST 


本 


Ri 


,及 了) 


| excz) — hiCx ax 


ER 
式 有 
ECMC R,, - 
fl 
一 > | ae)ar 
车 王 十 
如 果 要 ,RY 是 9 的 男 -一 个 划分 ,其 平均 误 判 报 失 为 
ECMCR?, ,RD = DD 人 | 
于 是 
ECM(Ri,:-:,R) — ECM(C Rt,.:. 
2 
t=1 j=1 来 
RA 
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由 于 在 Rj 中 的 点 * 是 满足 (2.27) 式 ;因此 宪 RIN RY 中 的 x 使 得 
CAAX) 一 AX) 所 0， 故 上 式 小 于 或 等 于 0, 从 市 Bayes 划分 
Ri 及， 使 每 平均 误 判 损失 最 小 。 目 
根据 定理 2.3 便 可 得 到 多 总 体 的 Bayes 判 列 规 刚 : 
当 第 得 min RCXI 一 HH x Er: C2.29) 
如 x 上 竺 得 min, hi 一 ACE x 为 
x ,x 中 的 枉 何 一 个 )。 如 果 误 淹 损 和 失 都 相间 ,不妨 假定 芍 为 


1， 此 时 hiCx)— Do Pifilx), {A 1, 2 g), 并 注意 到 
{4 . 


Bk) 一 DD Dif xO— pf ), 且 Pra”™ fiCx) 最 大 等 价 于 在 玉生 


最 小 。 于 是 对 于 误 判 损失 相等 的 情况 ， 有 如 下 简单 的 判刑 规则 : 
当 x 使 得 Pf) > pif x), C3 ff 1,+-*,4) 时 ， eal 


XE A (2.30) 
或 者 

当 xx 使 得 nfpjfCx)] > in[fpfi(x)] 对 所 有 ?jj， 淹 
x € x C2.31) 


者 则 (2.30) 与 后 验 概率 最 大 规划 是 相同 的 . 

一 般 Bayes 规则 (ECM 和 级 小 化 靶 则 ) 包含 了 三 类 量 : 先 验 
概率 、 误 判 损失 和 密度 殉 数 。 因 此 把 这 个 规则 仁 诸 实现 时 ,必须 定 
出 前 两 类 晶 的 值 ,并 利用 样本 对 密度 函数 中 的 未 知 参数 作出 估计 。 

我 们 将 上 述 多 总 体 的 Bayes 判别 规则 应 用 到 正 态 总体, 且 只 
讨论 误 判 涡 和 所 相等 的 精 况 ， 

设 ri 一 1,2, 4。 都 是 正 态 总 体 Np ,ZF;), 2; > 0. 
其 密度 为 


fx) 一 (2z) | zi exp | 六 Cx ~ pOY ETAx — pt) } 


i 二 


。 57 了。 


假定 误 判 损失 都 相等 ,判别 规则 C2.31) 成 为 
当 np = ng, — 了 ln2x 一 in 15j| 


1 — p07 一 ae 


Pp | 1 
-max | Px 2 i 2 | 


一 十 Cx 一 ROY ETC 一 pe) 时 
” 则 判 x 归 给 四 。 消 去 与 放 无 关 的 常数 项 一 2 m2x， 并 记 
dx) = lnpi 一 过 [In i320l + Cx — pOY BFC — ppt))] 


R12,::g (2.32) 

称 diCx》 为 样品 x* 在 第 忒 个 总 体 的 二 次 泣 别 得 分 ， drCx) 综合 

了 广义 方 鞋 1341， 先 验 概 率 pi 以 及 x 到 pb 的 马 民 肛 离 对 判 
到 的 贡献 "， 此 有 时 判别 规则 可 简洁 地 窟 为 : 车 样品 x 使 得 

d(xX) 一 maz {d(x)} (2.33) 


别 * 羯 给 总 体 mi。 

在 实际 应 用 中 , 若 诸 po，3x 未 知 ， 则 用 样本 对 它们 作出 个 
计 ， 

如 果 诸 总 体 的 协 方 著 阵 相等 ,; 即 3, 一 .一 BA 下).(2.32) 
式 变 成 了 (消去 了 与 夫 无 关 的 项 ) 


dXI = XE RE 一 到 pt Sip ln pr {2,34) 
显然 dx 是 线 狂 的 , 判 到 的 规则 与 (2.33) 相 同 , 即 样品 x 使 得 
Hx) max {diKx)} (2.35) 


则 x 判 给 x;。 若 jg 吕 与 允 未 知 , 那么 用 冬 本 对 它们 作出 估计 ， 注 
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意 刘 ,此 时 了 的 估计 是 
《ai 一 1)5 十 十 (ny 一 1 
一 3 一 Ca 二 9 
其 中 上 ,34 分 别 为 总 体 zi 的 样本 容量 及 样本 协 方差 阵 ， 
例 22 对 三 种 军 尾 花 分 别 括 取 了 一 二 一 ;一 50 的 样 
本 ,并 对 两 个 变量 x*, 一 社 办 宽 ， x, 一 花 苯 宽 进 行 测 量 ,计算 得 
/0.0661 0.0298 
本 (0.0208 00601) 


{2.36) 


rR 3.46, 0.25Y 5 


. 0.0711 0.0333 
wa (2.77, 1.30Y s.—( ) 


0.0333 0.0400 
0.0588 0.0323 
0.0323 0.0810 
三 种 和 总 尾 花 的 两 个 变量 服从 二 维 正 态 分 布 且 有 相同 的 协 方差 
阵 (参看 第 五 章 例 5.2), 由 5;,5; 和 5, 对 三 的 估计 为 
0.0653 0.0318) 
0.0318 0.0604 


x 9, 201Y 5 -( 


49 


gi 一 0.0604 一 
.0.0029 一 0.0318 0.0653 
设 三 个 总 体 的 先 验 概率 相等 以 及 误 判 损失 相同 ， 消 去 与 标号 无 闫 、 
的 因子 与 项 ,三 个 线性 判别 得 分 为 
人 CE) 一 0.2009x4 一 0.0937%, 一 0.3358 
d(x) = 0.1259x, 十 0.0032%, 一 0.1723 
xz 一 01045r 十 0.0425x, 一 0.1885 
对 于 新 给 的 样品 x, 一 (2.8,1.5》 应 判 给 哪 一 个 总 体 ? 将 x, 代入 
dx)》 得 
dCx,) 一 0.0861，d(z] 号 0.1754, d(xX,) = 0.1679 
最 大 者 为 碟 (x,)， 根 据 判 噶 法 则 知 x 应 判 给 二 即 判 为 第 二 种 过 
尾 花 ， 
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四) 判别 规则 的 评价 

判别 规则 壮 能 的 评价 ， 主 要 是 通过 计算 它 的 误 淹 概 率 和 的 大 小 
来 衡量 。 对 于 两 个 总 体 的 情况 ,由 C2.62 和 2.8) 知 道 对 于 时 判别 规 
则 所 确定 的 判别 区 域 RR,，R， 产生 的 误 兰 概率 总 和 【《total proba- 
bility of misclassification) 六 

TPM — p, 上 fx)ax + ps) flxddx C2.37) 
Rs ~ A 

办 此 计算 某 判 别 规 旭 的 总 误 判 琶 率 时 ,必须 知道 总 体 的 密度 、 先 验 
概率 及 判别 区 域 . 

鲍 2.3 对 二 个 正 态 总 体 Np ,22 i 一 1,2， 并 假定 PB 一 


pi ~ 站, 误 判 李 失 相等 , 且 设 为 1 , 求 Bayes 判别 的 总 误 判 概率 ， 


由 定理 2.2 知道 Bayes 的 判别 区 域 为 
Ri 一 {x: Wx) > 0} 
{g 一 {x:W(x) < 0} 


其 中 WCx) 一 | we pa 十 ze 3D 一 下 的 ， 由 于 xx 


为 元 正 态 分 布 ,根据 多 元 正 态 分 布 的 性 质 知道 WCx》 为 一 元 正 
态 , 其 的 值 为 


站 一 CR pIY Ep 一 加 (ae 一 gOYE po + pps) 


工 


一 于 CR 一 EC 一 Ai) 一 二 当天 6 机 


吕 
mp pS (pp tn 


其 方差 为 
gi ， (a? -一 和 一 站 ca 2 无论 XE zl 或 不 世 a 
上 面 式 子 中 的 由 一 (am 一 pa 一 ai。 它 正好 是 杰 
与 mm 的 马 氏 距离 平方 。(2.37) 式 的 总 误 判 梳 率 可 写 为 

了 了 厅 * 


TPM 一 > [PKz/17 十 PC112)] 


硼 
PC211) 一 下 机 fx < Ox €E x) 
一 POWCOX) < OW ~ Nm )) 
pp (= 已 了 xE | 
Pp (= "4 [= E 二 
一 并 
°(-4) 
类 凯 地 可 录 得 


， ‘WOX)— 4 
PC1/2Y~= P 2 ~ 
《1722 \ 了 3 


-ee 人- 习 


其 中 @(*) 为 一 元 标准 正 态 分 泡 数 , 于 是 总 的 误 判 概率 为 
mw 人 D+- 到 -人 


在 一 般 情 况 下 ,总 体 参 数 是 来 知 的 , 它们 通过 样本 来 估计 ， 此 


时 钱 性 浏 别 函数 全 是 (2.22) 式 , 即 Anderson 线性 判 关 郴 数 
WX) 一 XC 一 二 【 译 9 十 5 ) 8 (XD 一 EY 


它 的 分布 就 不 是 一 元 正 态 了 ， 但 可 以 证 阴 《 人 参看 [7]) 当 xc sy 
mm -> oo 时 V(x) 的 极限 分 布 为 XLS， f ). 当 oo 


时 WCx) 的 家 限 分 布 为 (一 到, 个) 其 中 


人 一 Ca — pyYE Cp _ 一 pp), 


如 旧 总 体 不 是 正 访 情况 ， 有 有 时 变 得 十 分 复杂 ， 因 此 在 实用 .上 
我 们 引进 一 个 所 谓 的 明显 误 判 率 (apparcnt error rate》: 将 两 个 
9 了 7 


PE 


一 下 


总 体 的 样本 代 六 判罚 函数 进行 回报 ， 判 错 的 样本 个 数 占 总 样本 的 


比例 ， 1 
” 设 总 体 zw 和 x 各 有 容量 为 mm 和 ;的 样本 , 记 
nw 一 wt 中 的 样本 判 入 = 的 个 数 
nm 一 zy 中 的 样本 判 人 人 x 的 个 数 
则 明显 误 判 家 为 


APER 一 ee (2.38) 
上 Fj 


明显 误 判 率直 观 且 容 易 计 算 。 但 它 作为 真正 的 总 误 判 概率 的 一 个 
估计 ,总 是 人 博 低 的 ,这 是 因为 判别 枯 数 的 建立 正 是 利用 了 这 些 样本 
的 信息 , 反 过 来 取 对 这 些 样本 进行 判别 ,其 效果 当然 会 比 判 别 其 它 
个 体 好 。 要 解决 明显 误 判 率 依 低 的 问题 除非 样本 容量 m,n 都 很 
大 ， 和 否则 这 个 间 题 无 法 从 根本 上 解决 。 现 在 已 所 出 一 种 刀 场 法 或 
老 称 为 Lachenbruch 的 保留 法 来 估计 真实 的 误 判 概率 ， 具 体 化 
法 是 : 

1” 从 总 体 的 样本 开始 ,剔除 一 个 祥 品 用 狂 余 的 本 一 ! 个 
样品 和 总 体 天 的 六 个 祥 品 建立 判 列 函数 ; 

2? 用 1? 建 立 的 判别 极 数 去 判别 刚 剔 除 的 那个 样品 ; 

3 重复 1° 和 2° 直到 = 的 样品 都 被 判别 过 ,用 培 , 记 错 判 
的 个 数 ; 

4” 对 志 重复 1°,2* 和 3? 的 作法 ,并 上 用 邓 。 记 钳 判 的 个 数 。 


我 们 用 “十 ai 来 作为 实 实 总 误 判 酸 率 的 信 计 ,容易 看 出 


刀 团 法 的 缺点 是 计算 量 太 大 。 但 对 于 各 种 判别 规则 ， 如 果 编 情 了 
专门 的 程序 ,那么 此 法 还 是 可 行 的 。 
对 于 多 总 体 的 情况 明显 误 判 率 为 


APER 一 by » /DD 1 (2.39) 
其 中 击 表 示 第 i 个 总 体 的 样本 容量 ，#;。 表 示 第 了 个 总 体 的 样本 
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到 


错 判 到 其 它 总 体 的 个 数 。 
§7.3 Fisher 判 别 


(一 ) 两 总 体 的 情况 

首先 考虑 商 总 体 的 Fisher 的 判别 间 题 。 设 两 个 了 ? 维 总 体 为 
和 zs 旦 都 有 二 阶 矩 存在 。Fisher 的 判刑 思想 是 变换 多 元 观 赛 
站 到 一 元 观察 yY， 使 得 由 总 体 wx， 和 产生 的 了 了 尽 可 能 的 分 离开 
来 . 例如 x 和 x 为 二 维 总 体 ， 如 图 3.1(a》 所 示 ” Xx" 为 x 的 点 ， 
“外” 为 的 点 ， 它 们 分 别 在 #1 轴 和 加 轴 上 的 投影 有 很 大 一 部 分 
是 重 公 在 一 起 的 , 故 要 用 原 变 是 x,,* 的 取信 范围 来 所 二 与 x 分 
离开 来 是 困难 的 。Fisher 提出 把 到 和 做 x* 一 《zi,x2) 的 线性 组 
合 ， 刚 | y 一 eit TT Gry 它 是 三 维 空间 中 的 一 个 乎 面 PP, 只 村 适当 
的 选取 坟 与 c: 使 得 x 上 的 点 与 *: 上 的 点 投影 在 P 平 面 上 尽 可 
能 的 分 离开 来 , 即 在 ” 抽 上 尽 可 能 分 离开 来 ,如 图 3.1 的 (8m 的 
5 个 点 与 ;的 5 个 点 在 ”》 轴 上 已 完全 分 离 和 开 了 ， 


ym tix ans 


4 x 
直 ey 
- 1 下 人 全 
0 7 $ | 和 少 
《 i 
: ~、/. 
人 RNV 
(3 
图 3.1 
没 在 了 维 的 情况 下 , x 的 线性 组 合流 
y 一 六 (3.1) 
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， 此 有 


其 中 ! 为 了 维 实 向 量 。 设 vw 和 x 的 均值 向量 分 别 为 sp? 和 P， 
且 有 公共 的 协 方差 短 阵 F(Z > 0)、 那 么 线性 组 合 y 一 1x 的 均 
值 为 


py 一 ECy/fx ED 一 站 《3.27 
ay 一 BOYfx Ex) = Up? (C3.3) 
其 方差 为 
a vary = tal (C3.4) 
考虑 十 


Cr 一 和 or) TPR 一 po) 了 _ CBY 
— mT (35) 
其 中 8 一 pe 一 py'” 为 两 总 体 均 值 向 量 差 , 根据 Fisher 的 思想 
我 们 要 选择 1 使 得 (3.5) 式 达到 最 大 ， 
定理 3.1 x 为 P 维 随机 向 量 , 设 y 一 x, 当选 取 [ 一 < 了 -号 
二 c3-(p 一 me ss 和 的 常数 ) 时 ,(3.5) 式 达到 最 天 . 
特别 当 = 二 1 时 ,线性 函数 
香 一 下 一 《一 下 全 了 于 区 C3.6) 
称 为 Fisher 线性 到 别 函 数 ， 
证 明 : 由 第 一 章 中 的 定理 3.13 便 得 证 . 是 
令 


天 一 二 (py 十 Ap) 一 二 Ca 十 Yi) 


一 村 CR 十 Ra Ep 一 Re (3.7) 


定理 3.2 利用 上 面 的 记号 , 取 一 《Cp 一 3273 则 有 
my KK>0 
py KD 

证 明 : 当 x Em 时 ,pm 一 pe 一 (ka 一 Ray3-pe 因 


C3.8) 
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1 一 履 一 【RD pOY Ei 


-一 加 《Re 十 ED) FE Cp -一 下 
一 六 [Cam poYE pp) >0 


上 式 的 不 等 号 是 利用 到 五: > 0. 
岗 祥 , 当 x 时， jp 一 To 一 (CR 一 R37 ER ， 因 此 有 


pu — Ko — I 一 Ho 3 一 pe)<0 


由 定理 3.2 我 念 得 到 如 下 的 Fisher 判别 现 则 : 
当 (pa 一 区 六 站队, 羯 x< n 
当 《CR 一 POLY KH, x En 
在 实际 中 荐 出 现 (Cp? 一 8273 一 下 有 时; 则 可 糙 x 判 给 ri, 也 
可 判 给 x;, 但 要 导 重 处 理 ,为 了 方 使 我 们 把 它 归 给 wv, 福音 到 (3.9) 
中 让 是 由 (3.7) 所 定 父 ,那么 有 
Wr) 一 《HT po 2 x K 
et Cp 一 Pa73-i 一 过 《有 于 pIY Ea 一 pj) 


(3.9) 


一 交 一 了 Ca 十 p19)) CD 一 py C3.10) 

这 样 判 别 规则 C3.9) 便 可 写成 . 
当 x 使 得 W(tx) 宕 0 亲人 C3.11) 

当 x 使 得 Wtx》 过 了 时 , 判 xx 
将 C3,10) 与 (1.9)、《2.206) 比 较 , 它 们 完全 是 一 样 的 , 且 当 Bayes 
判别 的 两 总 体 ( 正 态 总 体 ) 的 先 验 概率 相等 . 误 淹 损 失 相 等 时 ,三 种 

判别 除了 判别 函数 W(x》 相 向 外 ,判别 限 都 是 0 
当 总 体 的 参数 末 知 时 ， 我 们 仍然 辣 前 几 节 一 样 用 样本 来 对 
HD、 人 3 及 于 进 行 估计 。 注 高 到 这 里 的 Fisher 判别 与 最 小 虐 离 
羯 别 一 样 不 需要 知道 总 体 的 分 布 类 型 ， 但 两 总 体 的 均值 向 量 必须 
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有 显著 的 鞭 异 才 行 ,否则 判别 无 准 义 。 如 果 总 体 为 正 态 ,均值 向 晶 
的 差异 性 检验 可 按 第 五 章 所 介绍 的 方法 进行 。 

《二 ) 多 个 总 恢 的 情况 

现在 我 们 将 站 个 总 体 的 Fisher 判别 推广 到 多 个 总 体 。 两 个 
总 体 的 Fisher 浏 别 , 是 将 上 个 指标 圭一 《xz yx) 综合 成 一 
个 指标 y 一 x 来 代替 ?个 愿 变量 进行 判别 , 而 且 要 求 苏 个 总 体 
的 点 在 上 尽 可 能 地 分 离开 来 ， 推 广 到 多 个 总 体 的 情况 ,我们 想 
用 少数 几 个 综合 指标 Px i127.。 Hr ps, 来 代 
替 原 变量 进行 多 总 体 的 判别 ,而 且 要 求 8 个 总 体 在 这 7 个 综合 指 
标 上 尽 可 能 地 分 离开 . 

设 4 个 总 体 xz，i 一 1,2,-"…,g， 有 正定 的 公共 协 方 差 和 矩阵 
2 的 均值 向 量 为 pg 中 记 


BR- Dp Bm Dp — Rp®— RY C3.12) 
考虑 线性 组 合 了 一 x,! 为 p 维 实 向 量 ， 对 于 总 体 = 相对 


应 于 3 的 均值 和 方差 为 
o— Eylx Ex) = Ellxlxer) Tp (3.13) 
gl = var(y/x Er} —= 12 (C3.14) 
记 一 
和 一 本 3 Kis (3.15) 
考虑 比 


生 此 
DepBY DID 一 PR 
i=1 _ 一 ea - Bl (C3.16) 
o? I'sil 1'¥1 
显然 《3.16) 是 (3.5) 的 推广 .我们 选择 【使 得 (3.16) 达 到 最 大, 为 了 
方便 ,我 们 约定 《24 一 1， 
定理 33 设 生 世 和 芝 0 为 荆 电 的 * 人 个 非 零 


特征 报 。* 之 min tg 一 1, 《见习 题 7.57， 思 ee 为 相 应 
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的 特征 向 是 《满足 eX3e 一 1), 刚 五 一 所 笠 便 得 (3.16) 达 到 晤 
大 ， 称 Lx 一 eix 为 第 一 判别 函数 .除去 fx， 则 【, 一 @， 是 存 
约 训 条 件 corClix ,Ux) 一 0 之 下 使 得 《3.16) 达到 最 大 的 解 ， 称 
x 一 ex 为 第 二 判 天 函数 。 类 推 下 去 , 除去 上 x,-…' ,Hx， 则 
下 一 ef 是 在 约束 条 人 性 covCx, [Xx) 一 0 1 之 站, 让 一 2 
之 下 使 得 (3.16) 达到 最 大 ， 称 x 为 第 大 个 判 型 函数 。 同 时 
varCtx} = 1, f= 1,2,.**,s. 


证 明 令 一 到， 《3.17] 


则 有 . 
aa— [258 = [Sl, 
人 三 -二 在 卫 - 当 ae 一 Bl 
改 求 (3.16) 的 极 大 值 癌 题 化 为 求 
Basa C3.18) 
[人 
的 级 大 值 问题 、 没 雯 六福 基 0 为 号 让 3 二 的 : 
个 非 零 特征 根 ， er, er, 2 ,er 为 相应 的 单 征 化 正 交 特征 向 量 ( 始 ] 
长 度 为 1), 由 第 一 章 定理 3. 14 知 (3.18) 在 .aa 一 er 达到 最 大 值 
且 最 大 值 为 +。 由 (3.17) 知 它 等 价 于 在 上 ,一 了 -ey 处 达到 ， 且 
.有 
| 
. qs-iB5-Sa 、 
而 max 一 奸 ， 且 在 Ga 一 ez 处 达到 , 同样 由 (3.17) 
二 1 | ， 
知 它 等 价 于 在 上, 一 3-#e? 达到 ,又 
covf x Lx) = [Zl = efter 
varll:x) — LZ — er et =—1 
一 般 地 有 . 
max 2 B23 +， 且 在 a 一 ef 处 达到 ， 同 样 等 从 于 


和 
天 三 旺 
西昌 


在 人 一 全 ex 达到 ,而 且 对 一 切 了 < 天 一 2 ss 有 
ea 3223» 


covelix 一 站 3 一 ee 一 

war = Zl ee 一 
最 后 我 们 还 要 证 阴 站 “为 开 B 的 特征 向 量 二，ez，…… en， 
因为 82 ey 一 47e?， 两 边 同时 左 舟 3 二 得 

了 去 ez) 一 18( 卫 -二 ez 
上 上 式 表 明了 3tez 一 为 矩阵 38 的 特征 向 量 ea# 是 3-718 
的 特征 委 1 一 1, 2 和 
当 总 体 的 均值 向 量 po 一 12… 3。 和 了 来 知 时 ， 与 往 

党 一样 要 用 总 体 的 祥 本 来 估计 它们 , 设 x 个 ,x 名 为 总 体 x; 的 
容量 为 #; 的 样本 避 一 1,2…-…9)， 样 本 均值 向 量 和 其 方差 阵 分 
别 为 


Rl L Sxp, Si 一 SY Cx ~— RC — RDY 


MH fl 起; l 71=1 


C3.19) 
总 的 样本 均值 向 是 为 


作 my 


+ . 本 
无 一 二 >) 放下 中 一 二 3 XxX 其 中 WR 一 >) #: C3.20) 
和 


但 Em kml j=l 


而 
A Fe 一 2(xtp 一 到) 


= 1 — 
Le i | Do Ds™ 
见 我 们 用 这个 ,至 .让 各 5 分 别 来 代替 pRB 和 和 卫 。 下 外 ,注意 


(3.21) 式 中 4 为 8 的 一 个 信 数 , 因此. max 5 如 与 max EL 有 


rst +: EAl 
相同 的 解 ， 并 有 如 果 A471h& 一 乱 ， 则 -1Be 一 《一 9)12， 即 
A 与 S- 让 有 相同 的 特征 向 量 E, 于 是 可 以 用 全 寺 的 特征 向 
量 名 来 表示 极 值 问题 的 解 。 这 样 我 们 可 以 得 到 多 个 总 体 的 第 ; 
个 Fisher 样本 判别 梢 数 
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人 14 {3.21) 


hn- “rr oneness 


赂 铬 几 幸 联 涛 明 租 全 仿 VY 三 1 第 
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EX lt 《3.227 
其 中 己 为 4 二 的 第 i 个 大 的 特征 根 所 对 应 的 特征 向 量 , 旦 满足 
ES@ 1, sa — 0, (ik). 

至 此 我 们 已 讨论 了 如 何 建 立 多 个 总 体 的 Fisher 判别 函数 ， 
其 判别 规则 如 何 确定 呢 % 在 介绍 色 别 规则 之 前 先 看 一 个 例子 。 

例 3.1 从 三 个 不 同 的 地 区 采集 了 56 个 晨 油 样品 ， 每 个 样品 
测试 了 5 个 指标 : 一 V《 负 )，s* 一 Fe3 《 铁 #)，ws 一 了 让 《( 皱 #)， 
一 人 人 忽 和 烃 )!，% 一 芳烃 。 根据 其 化 学 成 份 这 56 个 样品 归属 
于 三 个 钞 兰 属 (三 个 总 体 )》: 


xi Wilhelm 沙 兰 《Cm 一 7 个 样 证 > 
xa: 低 Mulinia 小 畦 (ns 一 11 个 样品 ) 
zy; 上 访 岩 Cn 一 38 个 样品 》 


测量 的 原始 数据 列 于 表 3.1. 
从 表 3.1 的 数据 计算 得 
Kl (3.229, 6.589, 0,303, 0.150, 11.54Y 
EN we (C4.445 5.667 0.344 0.157 5.454Y 
RV 7.226 4.634 0.598 0.223 5.768Y 
下 一 【6.180 5.081 0.511 0.201 6.434Y 
187.575 
1.957 41.789 
-一 | 一 4.031 2.128 3.580 
1.092 —0.143 一 0284 0.077 
79.672 一 28.243 2.559 —0.996 338.023 
这 里 一 min(g 一 1,p) 一 min(2,5) 号 2， 4- 鞍 有 两 个 正和 的 特 
征 根 4.354 和 0.559，Fisher 的 两 个 线性 判别 函数 为 
秃 一 0312x; 一 0.710xa 十 2.764z3 十 11.809z — 0.235xs 
y= 0.169x) — .245x2 一 2.046xs 一 24.453 ~— 0.378xy 
以 (六 , 各 》 组 成 一 个 二 维 的 判别 空间 ， 将 三 个 总 体 的 三 组 样本 数 
据 和 它们 的 岩 本 均值 向 量 回 伐 到 判 吕 函数 为 ， 天 ， 并 且 把 它们 点 
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在 二 维 关 别 空间 中 ， 由 图 3.1 可 看 出 三 类 分 离 得 比较 好 。 对 于 一 
个 新 样品 ,自然 地 想 色 应 将 它 归 给 虐 三 类 的 均值 点 最 近 的 那 一 类 ， 
由 此 我 们 可 以 来 建立 多 总 体 的 Fisher 判别 规则 。 


图 3.1 日 表示 x3 六 表示 zy; 口 表示 wy 入 表示 询 什 

我 们 已 建立 的 :个 判别 函数 为 一 上 x 大 呈 1,……,j， 第 
们 组 成 一 个 判别 通 数 向 量 y 一 NY》， 其 均值 向 最 为 
Ey 一 (Ey,,*…- ,Ey》》， 对 于 总 体 x 而 言 ,有 

击 -= ECy/x Ex) 一 《Ri “ py 
mm 《Te ， -DY 

对 于 性 给 的 新 样品 x。, 由 判 吕 函数 它 对 应 着 一 个 一 Cy， 
yj ， 它 到 pg 扩 的 欧 氏 距离 平方 (因为 ,…** ,各 不 相关 所 以 采 
用 欧 氏 距离 ) 为 


DiCy,, KY 一 HOY (yo— pH = PCy 一 大 (3.23) 
X=} 
sl ss ?好 
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国 下 多 总 体 的 Fisher 浏 别 规 则 为 ， 如果 对 样品 < 有 
(Ce 一 ,Din, DiC ys pe) (3.24) 
则 将 | xo € Tjs 若 满足 [53.24) 式 的 标号 有 下 让 4) 
则 可 判 x 给 ,i 中 的 任 一 个 . | 
在 Bayes 判别 中 , 对 于 有 和 相 区 协 方 着 给 阵 2 的 多 个 正 态 总 体 
的 判别 ,我 们 定 头 了 线 注 判别 得 分 (2.34》, 即 
dt) 一 XE-ipb 一 加 PE 十 in pe 


成 等 价 地 为 
dt(x} 一 XE xX- (x — ME 一 jy 十 in pr 
读者 可 以 证 明 如 下 定 班 。 


定理 3.4 设 各 一 Ux， 其 中 一 -3et,， ex 为 已 二 再 号 得 
的 第 个 大 的 特征 根 嫌 对 应 的 单位 化 正 交 特 征 商 量 , 则 有 


i) > CW pi by [Cx 一 pr ) 1 
=1 Ck 
一 人 x 一 eS, 一 P) 


2C—drCx) 十 一 x ix 十 inpy) 
让 ) 车 社 守 村 守则 


了 (一 ma》 与 i 无关, 即 前 s 个头 或 者 说 (94 一 p> 


Kar 人 tl 
对 判别 有 贡 蔷 。 
ii 对 多 个 具有 相同 女方 差 阵 的 正 态 总 体 判别 时 ， 若 先 验 碧 
率 相等 , 误 划 损失 也 相同 ，Fisher 判别 和 Bayss 判 列 (2.35) 是 一 
如 音 前 > 个 判 副 函数 Cr 之 #) 已 足够 反应 也 个 原始 变量 六， 
2 sXe 的 变化 《参看 第 九 章 主 成 份 分 析 )， 则 只 须 用 前 + 个 判 


a 3283， 


蚤 函数 进行 判别 ,这 时 判别 规则 为 : 如 果 对 于 样品 x。 有 
2 Co 一 wi) 一 pp LE Co 一 有 了 


一 min 3 [Cxo 一 人 下 (3.25) 


县 了 在 时 k=1 

则 涧 xo& zj。 若 满 足 (3.25) 式 的 标号 有 四 -人 六 《1 sr 和 和 
则 可 尖 xs 给 = :ni 中 的 任何 一 个 . 

羔 亿 于 前 面 的 讨论 , 菩 总 体 的 埠 值 向量 Re ,天 一 12， 4 
及 公共 协 方 差 阵 了 未 知 ,可 用 样本 均值 出 量 读 直 二 一 1,-m*,g 及 
样本 协 方差 阵 5 来 代替 ， 其 判别 规 刚 与 (3.247(《3.25) 一 样 。 … 

最 后 ， 我 们 从 对 总 体 分 离 的 贡献 来 说 明 前 上 个 判别 函数 比 后 
面 的 :一 + 个 重要 ( 即 第 九 童 中 所 讨论 的 前 + 个 主 成 份 提供 的 方 
差 百 总 方 羔 的 大 部 分 ?总体 xi 的 均 信 向 量 为 各 各 和 一 12 


9 它 到 总 的 均值 向量 严 一 于 > Reb 的 马 民 归 离 为 Cp 一 
Cee 一 次)， 利 用 9 个 总 体 的 均值 向 量 Ke 到 严 的 马 氏 距 
离 之 和 作为 4 个 总 体 的 分 离 程度 的 一 个 度量 , 即 用 
Dp: ~ Dp% — pS — Fi) (3.26) 
来 度量 4 个 总 体 的 分 离 程度 ， 
定理 3.5 沿用 前 面 的 记号 , 则 太一 忆 六 一 刀 44， 其 中 


和 六 为 于 县 《 吉 了 二 了 有 的 非 零 特征 根 ， 
Ln 一 … 一 一 0， 为 堆 特 征 根 ， 
证 胡 ; 令 P 为 矩阵 282 的 特征 商量 矩阵 ， 它 的 第 卡 列 
et 对 应 着 顺序 为 第 《个 大 的 特征 根 44。 由 定理 33 知 道 4 一 
于， 一 xX， 考 车 
y= hss) — PDE-S$x 
+ 329*. 


上 外 ECyfx Ext = PE- 反 ab， 


- 

一 1 LE 

严 一 上 上 六 网 一 PE 二 
k=1 


又 . 

(PE BE)— (pe— pIPP'E Hp 一 F) 
一 (Pb 一 有 EC 一 而 ) 

从 而 


六 一 Ci 一 下 3 一 再 ) 


是 二 1 


4 
-2 Cp By) Cp — By 


| 


™ > [LCs, 一 By 十 (par, 一 起 .六 十 “ 
| 


十 Cpriyp Foy] 
注意 到 对 总 体 zi, ps 一 B(x Er) 一 上 了 CD，Py 
一 eg 了 二 ， 所 以 上 式 右边 第 一 项 可 写 为 


3 党 ， 
Fp — pF = evs pt 一 下 (RD — RY 2 ser 
Rt kml 

-ers | ee 一 下 Go — FY | 2 -ze 
_ 电 二 启 
一 er EBBE-der = 2, 
上 式 最 后 一 个 等 号 是 利用 第 一 章 定理 3.13 类 似 地 有 
> 《Petri — By 一 his 了 一 2 


入 而 得 到 , 当 2 一 4 一 … 一 和 一 0 时 有 
证 量 
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由 定理 3.5 可 看 出 对 于 第 了 个 判别 函数 yj 一 人 x 一 ee 的 
均值 ny; 到 总 均值 及; 的 距离 平方 和 为 了 (at 一 Po 站 一 和 


它 表明 了 第 7 个 判别 函数 对 马 氏 虐 离 PD? 一 信 (pt 一 BY 3 


(Pt 一 下 的 “贡献 "为 5， 而 殉 关 入 关 … 关 ,因此 ,第 一 
判别 函数 对 D:“ 瑞 献 " 最 大 , 然后 依次 减少 。 如 果 前 *(r 到 刁 特 
征 根 之 和 相对 于 后 * 一 + 个 特征 根 之 和 大 得 多 ， 则 可 抬 后 * 一 
个 判罚 函数 忽略 去 而 不 致使 得 DP: 减少 很 多 ,这 个 思想 使 是 第 九 章 
中 要 介绍 的 主 成 份 的 思想 ， 
在 本 章 结 车 以 前 ， 我 们 再 翘 略 介 绍 一 下 常用 的 判别 分 析 中 的 
变量 选择 问题 ,与 回归 分 析 的 自 变量 往 选 问题 相 类 似 , 如 果 x 的 变 
重 个 数 户 过 分 大 ， 并 由 此 建立 上 述 的 判别 函数 ， 显 然 工作 量 十 分 
大 ,而 且 把 一 些 事 实 上 对 判别 不 起 作用 的 变量 也 罗列 其 中 。 因 此 
我 们 希望 妖 哆 出 对 判别 有 用 的 x 的 部 分 变量 , 并 由 此 建立 一 个 比 
较 简单 的 判别 函数 ,而 又 基本 上 保持 它 原来 的 判别 效果 。 由 此 就 
产生 了 下 面 两 个 问题 ; i 根据 什么 标准 决定 选 人 的 ”变量 对 于 
判罚 是 否 重要 ，ii) 如 何 引进 变量 和 剔除 变量 ， 
了 判 对 准则 可 如 下 决定 : 设 有 个 正 态 总 体 mi: NiCpe， 
3) Gi 一 1 ,rm); 我 们 根据 x 中 的 个 分 量 可 以 对 检验 地: 
pe 一 -一 Me) 作出 相应 的 检验 统计 量 ( 见 第 六 章 定理 4.1,4.2) 
Twa= |EI/IE + BI (3.26") 
如 果 耳 未 被 拒绝 ， 那 么 根本 没 必要 建立 判别 还 数 。 只 有 当 此 被 
拒绝 时 ,我 们 才 认 为 这 了 个 变量 对 于 区 分 天 个 总 体 是 有 音义 的 ,此 
时 才 有 必要 进一步 建立 判别 荡 数 ， 正 如 第 六 章 所 指出 的 在 tt 为 
真 时 ， 


Tp, ~ (C,H 一 ;六 1). (3.27) 

若 已 知 x 的 前 + 个 变量 对 于 判别 是 有 显著 作用 的 ( 即 上 面 P 

改 成 ”， 而 相应 tH, 被 拒绝 ), 那 么 余下 的 一 + 个 变量 是 否 还 有 必 
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村 引进 呢 ? 这 时 就 应 进行 检验 扣除 了 前 ”个 变量 的 影响 后 如 一 下 
个 变量 的 条 件 均 信 是 否 相 等 的 检验 。 即 检验 
Hp 一 中) 
从 第 二 章 定 理 3.2 知 
x x ~ NC ,E21) 
其 中 8 一 0 十 3322Cx 介 一 pi )， 从 而 可 羔 似 推出 似 然 比 
检验 统计 向 为 


To rn Blfl(E oF BYaal (3.28) 
其 中 4 一 4 一 A4514w， 且 当 三 为 真 时 
了 rn ~ ACP— rr mm 1), {3.29) 
并 且 此 时 有 关系 式 
To™ To* Torn (3.30Y 


出 千 实用 上 总 是 名 个 灾 量 依次 引进 ,从 而 当 取 p 一 + 一 1， 此 时 由 
第 四 章 (3.2) 式 有 


1 Tap 着 一 内 一 产 十 1 
Tu,py m—1 
~ Plm—1ln—m—p+1) C3.31Y) 


《3.31) 在 逐次 引进 变量 时 要 反复 使 用 。 

在 逐次 引进 变量 过 程 中 ， 当 已 汉人 了 个 变量 牛 考 感 第 ”二 1 
变量 是 否 需要 引进 时 只 须 在 (3.31) 中 取 pp 一 + 机 可 . 

1) 确定 了 判别 准则 后 , 基体 的 引进 《或 副 除 ) 变 景 的 方法 也 
与 回归 分 析 变 量 通 选 完全 类 位 ， 有 前进 法 ， 后 退 蕉 和 逐步 判别 法 
等 ,其 中 逐步 判别 方法 应 在 较 普及 ,由 于 逐步 判别 单 已 有 成 熟 的 程 
序 , 实 用 时 只 须 调 用 相应 程序 , 输 人 原始 数 痢 ， 即 可 找 出 对 羯 别 有 
影响 的 变 攻 并 建立 判别 方程 。 如 同 回 妇 分 析 的 变量 筛选 ， 我 们 应 
注意 到 ,和 运用 处 同 的 方法 选取 变量 时 选择 的 结果 有 时 会 不 同 的 , 需 
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要 详细 了 解 的 读 考 可 秦 阅 廊 献 1121， 


习 题 七 


7.1 讽 西 个 二 维 总 体 有 公共 协 方 荆 阵 ， 从 二 总 体 分 别 铀 取 了 窖 瑟 为 
ri 一 99 ma 一 8 的 样本 其 数据 加 下 ;: 


《ay 试用 最 小 起 离 法 建立 判别 函数 ; | 

(b) 设 的 先 验 概率 为 二 。r: 的 先 验 概 率 为 十。 误 判 损失 相等 ， 二 
总 体 均 为 正 态 ; 求 出 Bayes 判别 区 域 ; 

Ce) 试 比 较 上 述 丙种 判别 的 明显 误 判 率 - 

7. 3 某 科学 工作 者 要 建立 两 个 多 元 总 体 *, 和 ma 的 判 列 法 则 。 利 用 他 
奖 得 的 数据 已 对 总 体 密度 f(x)，f(x》 做 出 了 估计 . 设 CC21D 一 59， 
cCH22 = 100， 另 外 在 所 有 可 能 的 研究 对 软 中 ,大 约 有 20% 属于 ma。 


《s) 试 时 出 ECM 最 小 判别 规则 ; 

《by 设 有 一 个 新 绊 品 加， 使 得 (Cx) 一 由 :33 fy .5 x 应 淹 
人 哪个 总 体 ， _ 

7.3 荣 旨 区 将 农村 经 济 交 型 分 为 三 菊 ， ,一 一 较 定 裕 类 型 ，x: 一 一 中 
等 闫 出。m 一 “ 较 贫 困 闫 型。 每 种 类 型 以 五 个 指标 为 依据 : ” 一 土地 生 产 
率 一 农村 社会 总 产值/ 效 凸 地 面积 ( 百 元 /每 雷 )， 和 一 劳动 生产 率 一 农村 社 
会 总 产值 /农村 劳动 力 ( 百 元 /每 个 劳动 力 )，% ~ 人 均 路 入 一 农村 经 济 纯 收 
人 [农业 人 人 口 《 百 元/ 每 人 3， x 一 费用 水 平一 总 路 用 / 总 收入 > *， 一 农村 工 
业 比 重 二 农村 工业 产 信 / 农 村 社会 总 产值 。 每 种 类 型 分 别 有 窗 量 为 ,一 5， 
ns 一 4 *, 一 4 的 样本 (每 个 个 体 以 县 为 单位 ), 其 数据 如 下 : 
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Ca) 设 误 判 损失 相等 zz; 和 的 先 验 概 素 分 别 为 盖 站 ， 


2 一 方 和 所 一 车， 并 认为 三 总 体 列 是正 态 分 布 且 具 有 公共 协 方 差 阵 。 
试 作 Bayes 判别 。 

Cb) 试 作 Fisher 判别 。 

《5) 比较 两 种 判别 的 明显 误 判 率 ， 

7.4 考虑 三 个 总 体 的 Bayss 的 判别 问题 , 设 先 验 梳 率 , 误 判 损失 以 及 窗 


TL , TT . Hs 


将 | Cl/l)=0 CCl/2Y 一 500 CrK113)》 一 100 
倪 x Crt211) 一 10 C{2/2) = 0 CI/3) = $0 
开 ， CCI) 一 50 CC372) 一 200 Cr373 一 昌 
上 先 监 概率 所 一 0.05 pi = 0.60 Pr™= 0.33 


fx) = 0.01 fw) = 0.85 fw) 2 


度 滑 数 在 新 的 样品 点 *, 处 的 值 如 上 表 
Ga》 利用 (2.28) 式 即 ECM 最 小 的 规则 ,应 把 x 庆 给 哪 一 个 总 体 ? 
Cb》 若 所 有 误 判 损失 相等 ， 此 时 x 应 判 人 哪个 总 体 ? 并 计算 其 后 验 颖 
率 . 


7.5 设 和 zj 人 0 为 2 和 8 的 :个 非 零 村 征 根 ;证明 : 专 
min(tg 一 1sap)、 其 中 8 为 C3.12) 所 定义 ,为 4 个 p 维 总 体 ma 一 19239 
4 的 公共 协 方差 矩阵 (2>0)。 

?7.5 证 明定 理 3.4. 

7.7 设 总 体 xi 一 12…s9) 的 概率 密度 为 

le < 二 oo 
{x} 一 和 所。 . 
0 其 它 ， 
其 中 0<8,<p<…<ps 是 未 知 参数 , 且 设 泛 判 损失 相等 。 

(a) 若 先 验 术 率 相等 ? 即 户 一 总 > 一 1,2>…s9， 刚 Bayes 判别 区 域 

为 : Ri 一 【msai]。 其 中 


可 ) 一 
#1 一 十 OO， 


-提示 ; 由 于 5 一 二 RR 一 {refx) >fxx) 所 有 * 妆 站 再 注 章 到 


-2 log 全 + 当 B; 固定 它 是 BP 的 上 升 晴 数 》 


《pb 若 先 验 概 率 成 比例 ， 则 Bayss 判别 规则 租 当 于 将 所 有 个 体 都 判 给 


Tea 


《提示 : 只 须 证 明 Re = {#:#>0}3 + 
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第 八 章 聚 类 分 析 


上 一 章 我 们 讨论 了 判别 分 析 ， 它 考虑 的 是 已 知 8 个 总 体 x 
Ci 一 1,2,.…*,49)， 对 已 知 的 新 个 体 x 如 何 判 别 它 属 于 哪 一 个 总 
体 ? 而 本 章 讨 论 的 是 已 知 研 究 对 象 的-* 批 个 体 ， 如 何 依据 它们 的 
P 个 指标 (变量 ) 将 其 分 为 若干 个 类 型 。 这 就 是 从 类 分 析 方 法 ， 即 
“ 物 以 类 聚 " 的 统计 方法 ， 分 类 学 是 一 门 十 老 的 学 科 ， 从 前 人 们 进 
行 分 类 主要 是 依靠 经 验 和 专业 知识 ， 很 少 利用 数学 工具 随 著 科 
学 技术 的 发 展 , 特 别 是 近代 计算 机 的 发 展 和 普 吧 ,数学 这 个 有 力 的 


工具 逐渐 被 引进 到 分 类 学 中 ,形成 了 数值 分 类 学 ,由 于 数值 分 类 在 


发 展 的 过 程 中 首先 是 着 重 于 实用 ， 因 此 相对 而 言 理 论 上 还 不 太 完 
善 , 这 有 竺 进一步 的 研究 和 和 解决。 
本 章 讲 述 的 聚 类 分 析 是 数值 分 类 ， 基 本 目标 是 寻找 样品 或 变 
量 的 目 然 类 别 。 对 样品 的 聂 类 称 为 怠 型 聚 类 ， 对 变量 的 聚 类 称 为 
R 型 窜 类 。 在 第 一 季 中 我 们 先 介绍 样品 之 间 和 变量 之 间 的 关系 的 
度量 尺度 ,在 后 四 节 中 我 们 介绍 聚 类 分 析 中 最 常用 的 一 些 方法 


§ 8,1 相似 性 与 关联 性 的 度量 


数值 分 类 法 几乎 总 是 对 一 组 个 体 的 若干 变量 《有 时 也 称 为 指 
标 或 者 属性 ) 进 行 测试 ,并 建立 起 “相似 性 "或 “相关 性 ”的 度量 ， 而 
个 休 的 若干 变量 可 以 是 定量 的 也 可 以 是 定性 的 ， 定 量 的 可 以 用 数 
惜 表 示 , 它 包括 了 连续 变量 和 离散 变量 ,例如 个 体 中 某 元 素 的 含量 
多) 就 是 连续 变量 ; 个 体 中 竟 点 的 数目 就 是 离散 变量 .市 定性 变 
量 则 包括 名 称 的 (如 土壤 的 额 色 有 红壤 . 黄 竟 . 黑 壤 等 ), 次 序 的 (如 
种 子 的 大 小 可 分 为 大 .中 小 等 为 状态 的 (如 阴性 ， 碍 狂 等 )。 定 量 
的 和 宝 性 的 变量 可 以 互相 转化 ， 例 如 定量 变量 在 它 取信 范围 内 分 
割 为 若干 个 区 间 , 每 个 区 介 根 据 实际 问题 可 赋 于 一 个 名 称 , 此 时 变 


9 336 9 


为 定性 的 , 相 色 一 个 定性 变量 , 它 所 处 的 状态 ， 可 赋 于 适当 的 编码 
就 可 化 为 定量 的 。 当然 ， 关 于 变量 类 型 的 转化 还 涉及 到 许多 基体 
问题 ,这 方面 的 详细 讨论 可 徐 潭 f17]. 

《一 ) 距离 与 相似 系数 《Q 型) 

设 每 个 个 体 有 了 个 变量 ， 因 此 可 把 一 个 个 体 视 为 了 维 空间 中 
的 一 个 点 ,# 个 个 体 就 是 靖 维 空间 中 的 ”个 点 ,很 自然 地 想到 用 它 
们 之 癌 的 焉 离 来 衡量 它们 之 癌 的 对 近 程 度 。 在 $7.1 最 小 距离 兰 
别 中 ,我 们 已 介绍 了 距离 的 定 尽 以 及 列举 了 一 些 带 用 的 距离 , 即 对 
样品 点 x; 与 x) 有 

(1) 阴 若 夫 斯 基 距 离 : 一 


2 此 -| n>0 0 


取 严 一 152cc 分 别 可 得 到 如 下 三 种 距离 . 
《2) 绝对 距离 : 


di DS 1x 一 xaf | 1.2) 
C3》 欧 氏 窗 离 ; 


m=-l 


《4) 切 比 雪 去 距离 : 


di 人 a, } Eos oj | (C1. 4) 


以 上 的 几 种 距离 在 龟 型 北 类 中 是 常用 的 ， 但 各 变量 的 测量 值 相 
差 莫 殊 时 ， 要 党 标准 化 再 计算 距离 。 如 果 考 虑 到 个 体 的 了 ?个 变量 
的 相关 性 等 问题 ， 那么 我 们 可 采用 方差 加 权 相 离 或 马 氏 距离 

《52 方差 加 权 踢 离 : 


. 要 
一 各 《xuei 一 -| 《1.3》 


~( 守 和 二 之) C15) 
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(5) 马 色 荆 离 : 
di = (Xi XY Ex; — Xi) (1.6) 
由 于 将 个 体 视 为 了 维 空 间 中 的 点 ， 当 然 也 就 是 维 空间 中 的 
向 量 。 在 实际 问题 中 有 这 种 情况 : 两 个 物体 的 大 小 不 一 样 ， 但 珍 
状 极其 相似 ,这 两 个 物体 应 归 册 类 型 ,因此 引进 相似 系数 。 
《7》 相 似 系 数 


位， xoxo 
Xi aml 
cos Drie — 2 本 C1.7) 
cal nD fe 
守 
ql | 


如 果 个 体 的 各 个 变量 都 取 正 什 , 则 0<cos6,。 执 1。 当 
eos 9s 一 1 时 ,说 明 x; 与 x; 完全 相似 ; cos 9,,,sj 越 接近 于 
1 表明 xi 与 x; 越 相 似 。 

《二 ) 匹配 系数 

在 实际 问题 中 ,特别 是 在 农业 ,生物 及 医学 中 ,个 体 的 个 变 
量 都 是 二 态 变量 , 即 变 重 只 有 两 种 状态 、 如 尾 学 中 的 “ 明 人 性 "和 “ 阳 
性 ” ,植物 分 类 学 中 的 “有 有 按 毛 ?" 和 “无 边 毛 ”， 植 被 考查 中 其 个 植物 
品种 的 “存在 " 利 "不 存在 "等 等 。 对 于 这 种 二 态 变 量 我 们 引 人 编 码 
来 赣 划 , 即 变 县 处 于 某 一 -状态 时 给 予 编 珀 1, 而 处 于 另 一 状态 时 给 
予 编码 0. 例如 在 植被 调查 中 ,对 了 贾 个 样 地 (两 个 个 体 ) ; 与 坟 调 查 了 
五 个 品种 (五 个 二 态 变量 ), 沫 品种 存在 给 予 编码 1, 不 存在 给 予 编 
码 0, 调 查 结果 如 表 1.1。 从 表 1.1 中 可 看 出 , 样 地 ; 与 对 五 个 蛮 
量 来 说 有 两 个 (1 一 1 匹配 ,一 个 (0 一 0 匹配 和 两 个 非 匹 配 , 即 一 个 
0 一直 ,一 个 (1 一 0)。 关于 个 体 只 有 二 态 变量 的 情况 其 相似 性 ,可 
以 通过 定 立 各 种 匹配 系数 来 度 鱼 ， 这 种 具有 二 杰 变 量 的 个 体 相 己 
性 问题 比较 复 厅 ,要 根据 专业 知识 加 以 具体 考虑 ,一 般 二 访 变量 可 
分 为 对 称 和 不 对 称 ,车 将 5 与 1 局 等 对 待 就 是 对 称 的 ,如 在 植物 分 
类 中 “有 边 毛 "和 “无 边 毛 "是 一 个 很 重要 的 特性 ， 二 者 必须 同等 爱 

3 | 


i. 


家 1.1 与 天 两 个 样 地 调查 结果 


待 ,因此 它们 是 对 称 的 . 若 0 与 1 不 同等 对 待 就 是 不 对 称 的 ,如 在 
植被 考查 中 荣 个 种 的 “存在 ”与 “不 存在 * 在 许多 场合 中 不 能 等 则 对 
待 ， 因 此 在 具体 定义 具有 二 杰 变 量 的 两 个 个 体 的 匹配 系数 时 要 孝 
崎 到 对 称 福 的 问题 ， 对 于 不 对 称 的 清 况 有 时 《1--1) 匹 配 比 (0 一 0) 
匹配 的 相似 迹象 更 强 ， 在 这 种 情况 下 扣除 一 些 (0 一 0) 匹配 (甚至 
忽略 ) 是 合理 的 . 

为 了 定义 名 种 匹配 系数 我 们 利用 2 x 2 列 联 表 ， 设 个 体 i 与 
& 具有 ?个 二 态 变 量 ， 通过 观察 便 可 得 表 1.2 所 示 的 个 性 i 与 旧 
的 2 x 2 列 联 表 
表 1.2 个 你 与 A 的 2x2 列 联 表 


1 v 这 各 


1 人 下 a 二 +b 
0 < d | etd 
边 和 5 二 5 ~ 5+d pea+ 4 r+d 


表 1.2 中 的 《表示 (1 一 1) 匹配 对 数 ，z 表示 《0 一 0) 匹 配对 数 ,5 
和 分 别 表示 (1 一 0) 和 《0 一 1) 的 非 匹配 对 数 ， 关 于 匹配 系数 已 
有 十 多 种 定义 ， 表 1.3 殉 出 了 九 种 稍 见 的 匹配 系数 ， 

《 宇 ) 变量 的 关联 性 度量 (及 型 ) 

对 了 乡 个 变 景 进行 聚 类 , 即 只 型 聚 类 , 衡 重 变量 之 间 的 关联 程度 


» 3D 。 


天 1.3 具有 P 个 二 灾变 量 的 两 个 体 匹 配 录 数 


说 


明 


称 为 简单 区 也 系数 ， 对 (1 一 1) 和 人 一 
站 缔 同 加 权 ; 对 称 情况 . 


ae oy 对 {1 一 1) 外 K0 一 0) 臣 可 双 偿 加 枢 ， 对 


et dT bie 称 情 况 。 
要 二 攻 
ia Ty 对 非 匹 栈 衣 们 加 权 3 对 称 情 况 ， 


分 子 上 覆 去 只 一 中 匹配 非 对 称 情 况 ， 


仙 于 和 分 母 都 略 去 (0 一 了) 匹配 ， 非 对 
称 情 况 。 | 


分 子 与 分 母 都 赂 去 人 0 一 0) 匹配 。 对 
《1 一 蕊 匹 配 到 导读 权 ? 非 对 称 情 况 。 


分 子 与 分 母 都 咯 去 一 人 下 配 * 对 非 
匹配 京 倍 加 权 * 非 对 称 情 况 . 


除去 人 一 0 匹配，【〈1 一 已 匹 本 与 非 区 
配 之 比 ? 非 对 称 情况 。 


这 个 系数 是 Dehiai 1931 年 探 册 的 


OF Ba te 非 对 蒜 情 况 ， 


最 常用 的 有 相关 系数 及 变 最 的 夹 角 余 弦 .。 

《12 相关 系数 

设 有 +# 个 个 体 ,每 个 个 体 测 重 了 ?个 变 最 , 第 i 个 变量 喜与 
第 起 个 变量 x 的 相关 系数 海 
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> 《xi 一 Fi} CE 一 #4) 


让 号 


Pi 
/这 Cr FD) Cr 一 下 
im1 fi 


(1.8) 

(1.8) 式 的 相关 系数 是 大 家 熟知 的 。 在 茶 些 豪 类 中 人 负 相 关系 数值 
往往 由 它 的 绝对 值 来 代替 . 

对 于 二 态 变量 来 说 ,1.8) 式 可 以 写成 更 简洁 的 形式 , 事实 上 ， 

通过 观察 # 个 个 体 的 两 个 变量 x 与 崔 ， 恒 可 得 到 列 联 表 1.4.。 


家 1.4 < 与 < 的 济 联 衣 


变 置 芝 
边 阁 
杰 量 二; 


十 直 
e+e 


Ne 二 


其 中 。 表 示 变 量 加 和 #4 在 ?个 个 体 上 同时 取 1。 其 它 5、e 
和 4 有关 似 地 解释 。 这 祥 我 们 就 不 难得 到 二 态 变 量 x 与 x* 的 
相关 系数 为 (见习 题 8.2) 
gd 一 be - (1.9) 
[Ce bYet do + eB + A 
在 一 元 统 革 中 ， 我 们 知道 列 联 表 的 独立 性 检验 应 用 到 二 坊 变 
量 时 { 参 看 [1J)，, 检 验 的 统计 量 为 六 统计 量 : 


一 nad — bey . 
* (et bye da tt cdet+ od) El) 《1.107 


把 C1.10) 与 (1.93) 比 较 ,显然 有 


Fi 
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1 
ri 一 TT 


芭 说 明了 对 于 固定 的 x， 两 个 二 赤 变 量 的 相关 性 大 与 不 独立 的 概 
” 念 是 一 臻 的。 利 月 两 个 二 态 变量 的 列 联 表 ， 可 以 完全 类 似 地 构造 
吉 表 1.3 所 列举 的 两 个 二 态 变量 的 各 种 关联 系数 . 
如 果 两 个 变量 是 多 态 的 ,例如 x 可 以 取 7 种 状态 ，z4 可 以 
取 9 种 状态 此 时 它们 的 列 联 表 为 + x 9 列 联 表 《如 表 1.5 所 
示 ). 


窗 3.s x 与 x 的 rxq 列 联 表 


ni 家 示 在 # 个 个 性 中 变量 x 取 第 i 种 状态 ,变量 x 取 第 
个 状态 的 个 数 ，#;.， nt. 分 别 表示 列 联 表 中 的 行 和 与 询 和 ， 同 
样 由 一 元 统计 知道 x 与 x 的 独立 性 检验 统计 量 为 


LA 
rsy 六 Ce de 


fel k=1l 


《1.1}> 
建立 在 (1. i119 基础 上 的 关联 系数 也 是 有 很 多 ， 下 面 列 举 的 三 个 是 
最 常用 的 : 
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DG Ca 


ra CD) —( -一 站 ) (1,13) 


n* max(a— 1,r— 1) 


pe 二 
rit (3) (mr 一 本 (1.14) 


(2) 变量 的 夹 角 余弦 

每 一 个 变 最 在 ”个 个 体 上 都 有 一 个 观察 值 ， 因 此 每 一 个 变量 
可 视 为 # 维 空间 中 的 一 个 向 晤 ， 两 个 变量 之 间 的 关系 密切 程度 也 
可 以 用 它们 的 夹攻 余 驴 表示, 变量 2i 与 x 的 夹 基 祭 蒋 为 


"TE 
Cos Bt 一 (1.15) 


I ( 且 志 ) 


根据 上 述 的 思想 ,当然 可 以 计算 变量 w 与 x} 在 # 维 空间 中 
的 距离 来 衡量 它们 关系 的 密切 程度 ,但 在 实际 中 很 少 用 . 


§ 8.2 系统 聚 类 法 和 分 解法 


本 节 介 绍 两 种 请 类 方法 ， 一 种 是 将 类 由 多 变 到 少 的 系统 聚 类 
法 ; 另 一 种 是 将 类 由 少 变色 多 的 分 解 公 类 薄 。 为 了 贸 述 方便 ,我 们 
主要 讨论 吕 型 聚 类 ,而 丸 型 聚 类 只 通过 例子 来 说 明 。 

《一 ) 系统 聚 类 法 

系统 葬 类 恭 是 目前 应 用 较为 广 诈 的 一 种 聚 类 方法 ， 有 关 它 的 
研究 极为 丰富 ， 而且 有 专门 的 程序 .在 古老 的 植物 分 类 学 中 分 类 
的 单位 是 : 门 , 岗 ,上 下, 科 , 属 ,种 .种 是 分 类 的 基本 单位 ,分 类 单位 
越 小 它 所 包括 的 植物 就 越 少 ， 它 们 的 共同 特征 就 越 多 。 系 统 衰 类 
法 就 是 根据 这 一 思想 ,一 开始 就 把 每 个 个 体 自 盛 一 类 ,然后 把 最 相 
伺 的 个 体 首先 束 为 小 类 ,再 将 已 聚合 的 小 类 按 其 相似 性 再 聚合 . 随 
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闭 相 似 性 的 减弱 ,最 后 把 一 切 子 类 都 紊 合 到 一 个 大 类 ,从 而 得 到 一 
个 按 相 似 性 大 小 (或 接近 程度 的 天 小 ) 联 结 起 来 的 诬 系 图 ， 
在 系统 紊 灼 法 的 合并 过 程 中 涉及 到 亚 个 新 类 的 距离 问题 ， 关 
与 类 之 间 的 蝶 离 有 许 懈 定义 方 染 ， 不 同和 的 定义 法 就 产生 了 系统 春 
类 的 不 同方 法 。 用 di 表示 个 体 ; 与 个 体 ;的 距离 ,用 <， 和 = 
表示 两 个 新 类 ,它们 包含 的 个 体 数 分 别 用 wn, 和 m 表示 ,它们 的 
重心 分 别 用 4 和 表示 ，x， 和 x。 之 间 的 距离 用 Dr 表 
示 . 下 面 给 出 几 个 常用 的 类 与 类 之 季 的 距离 定义 ， 
. 《12 最 小 距离 ， 


Ds = mind;; (2.1) 
FEnpr ,es 


即 用 两 类 中 样品 之 间 的 距离 的 最 短 者 作为 两 类 的 距离 。 
(2) 最 大 上 距离. 
Ds 一 mard; 《2.27 
iEre:f Es, 


抒 用 两 类 中 样品 之 间 的 距 离 的 最 长 者 作为 阴 类 的 距离 . 
《3)》 路 心 距离 。 


D,,s 一 d(£, ,RE ) (2.3) 
即 用 两 类 的 重心 之 间 的 距离 作为 阴 类 的 距离 . 
(4) 类 平均 距离 。 
D 一 Da (2.4) 


pHiy jERp, ER. 


即 用 两 类 中 所 有 两 两 禅 品 之 间 的 距离 平均 作为 两 类 的 中 高. 
(5) 离 半 平 方 和 了 高 
DF 8, 一 二 《25) 
高 芝 平 方 和 的 方法 是 由 “Wara 首先 提 由 的 。 他 的 思想 是 来 自 于 
方差 分 析 , 设 <， 和 <， 的 离 关 下方 和 和 分别 为 
Se -= > (Cx; 一 R(x 一 ED 


ritnp 
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Se 一 人 (xi 一 元 DCxi 一 是 
FE 
其 中 ,于 ;为 = 和 ry 的 恒心， 将 =， 和 rw， 合并 成 x;， 此 
时 rr 共有 和 一 5, 十 14 个 个 体 ，x。 的 离 差 平方 和 为 
3 一 之 (Kx — KE) (Cx 一 站)， 
Er 
其 中 好 为 <， 的 重心 。 扫 合 并 后 所 增加 的 离 若 平方 和 (5, 一 
gr 一 Se) 定义 为 =， 和 x 的 深 离 。 可 以 证 明 《 见 (二 ) 分 解 聚 类 
读 ) 增 加 的 离 差 平方 各 恒 是 (2.5) 所 定义 的 。 

有 了 个 体 之 全 的 三 离 和 类 与 类 之 疗 更 离 的 定 久 后， 我们 便 可 
进行 系统 率 类 ,其 计算 步 又 为 : 

i》 “个 个 体 一 开始 就 作为 # 个 糯 , 计 算 两 两 之 记 的 距离 (或 
相似 系数 ) 构 成 一 个 对 称 阵 也 一 4di]。xn， 其 对 有 角 线 元 素 全 为 0 
《相似 系数 矩阵 ,对 角 线 元 素 全 为 1)。 显 然 , 此 时 Ds 一 4d,1， 将 
矩阵 娓 记 汶 Diw. 

”DD 递 择 Do 中 的 最 小 元 素 《 相 似 系数 矩阵 则 选 最 大 元 
素 ), 设 这 个 最 小 元 素 为 口 ,,， 则 将 =， 和 x 合并 成 一 个 新 类 
wj} 在 Do 中 消去 x,，，xe 所 对 应 的 行 与 列 , 并 如 人 
由 新 类 x, 一 1x,,xe} 与 翻 下 的 其 它 未 豪 合 的 类 的 距离 所 组 成 的 
一 行 和 一 列 , 得 到 一 个 新 的 距离 矩阵 Do。 显然 Do, 是 (sn 一 1) 
Xx (一 1) 阶 矩 阵 ( 注 ; 在 了 ao 中 如 果 还 有 另 一 个 最 小 元 案 , 则 
头 时 可 租 类 似 的 处 理 , 此 时 Do 为 《# 一 2) X (w 一 2) 阶 短 阵 )。 

iii) 由 Du; 出 发 重复 这 ) 的 做 法 得 到 Di， 再 由 Do， 出 
发 依 靶 炮制 ,直到 #* 个 个 体 聚 为 一 大 奖 为 止 。 

iv) 在 合并 过 程 中 要 记 下 合并 时 个 体 的 编号 以 及 两 类 合并 
时 的 水 平 《 即 两 类 合并 时 的 距离 系数 误 者 相似 系数 的 大 小 )， 并 给 
成 聚 类 谱系 图 ,根据 实际 闽 题 确定 类 的 个 数 。 

下 面 通过 例子 来 说 明 上 述 步 驮 对于 类 与 类 之 闻 的 上 距离 的 不 同 
定义 下 如 何 具 体 实施 。 
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15 最 小 距离 法 ， 
例 2.1 下 面 给 出 了 5 个 样品 两 两 之 间 的 欧 氏 申 离 矩阵 Bo， 
试用 最 小 距离 法 注 行 系统 聚 类 . 


TI TT TT 


i 0 

zm 14 0 
Do—x|5 9 0 

Tr 1 7 i0 0 

ns M6 3 5 8 0 


因为 一 开始 就 将 每 一 个 个 体 作为 一 类 , 上面 Dw 中 的 =; 表示 第 
i 个 个 体 x 一 1,2,……,5) 有 生 Djj 一 2 出 Du 看 重量 小 的 
元 索 为 . 
min{dj} — =] . 

将 一 一 x 合并 成 新 类 zs 一 tx 上 一 《zz 让 ， 求 新 
类 xx 与 剩 下 的 类 的 下 离 

Dios 一 min{disda)} = min{4,7} = 4 

Des = min{disydsa} — min{f6 ,10} 一 6 

Does = min{dywydsst = min{6,8} 一 6 
在 Dw 中 说 老 zw 与 所 对 应 的 行 与 列 启 , 加 上 we 与 ms Ty 
的 距离 所 对 应 的 行 与 列 得 Du 

Ns Hi Ms TY 
xe 了 
Do 一 于 “0 
60 9 0 
. mrs 6 3 5 0 
Dw， 中 的 最 小 元 索 汶 Dz: 一 3， 合并 x 一 2 得 x 一 
rns = {Xs} » 计算 zy 与 余下 的 类 x ,we 的 距离 
Ds 一 min{Dys,Dsn} 一 min{9,5} ~ 3 
Ds 一 min{Ds,ss Dss} 一 min{4,6} =— 4 


. 


消去 Du 中 x;，zx 所 在 的 行 与 列 ， 放 上 六 所 对 应 的 行 与 列 得 
Dy 


Du 中 最 小 元 素 为 po 一 4， 合 并 本 与 二 得 症 一 few 一 
{Xs Tr ss} 最 后 计算 TB 与 x, 的 距离 

Dss 一 min{Des yD} — min{6 ,5} = 5 
并 且 合 并 为 一 个 大 类 mm 一 fm)m 一 teay as my yz 至 此 ， 
对 弛 个 洋 品 点 利用 最 小 距离 的 系统 娶 类 完毕 。 归 纳 上 述 聚 类 的 过 
程 可 列 成 一 个 聚 类 项 序 表 《 表 2.1)， 并 可 画 出 相应 的 谱系 图 《图 


家:z.1 五 个 样品 点 最 小 距离 法 归并 顺序 表 


合并 的 类 。， 合并 后 类 中 的 元 素 会 并 水 平 ( 虑 离 ) 


1 4 Xe 1 
2 Ty ry sa {xs} 3 
3 Ty Hy F499 4 
+ re {3 F432 sa 3 


闻 2.1 五 个 样品 的 最 小 距离 法 谱系 图 
wn 了 和 7 8 


2.1)， 力 中 的 机 坐标 是 并 类 的 目 离 。 从 图 2.! 可 着 出 在 蝶 离 为 1 
的 水 平 上 可 分 为 4 类 :tryzj， {x {xy} ，{xs}， 在 距离 为 3 的 
水 平 上 可 分 为 3 类 : zyzj frayzjfa}。 在 上 距离 为 4 的 水 平 上 
可 分 为 2 类 : (xxxjy， fx 最 后 在 距离 为 5 的 水 平 上 则 五 
个 样品 全 都 合并 成 一 类 . 

最 修 距离 法 也 可 用 于 只 型 聚 类 , 即 对 变量 进行 系统 育 类 , 仍 通 
过 例子 来 说 明 ， : 

钢 2.2 对 某 地 超 基 性 岩 的 一 批 样 品 ,， 神 试 六 个 与 矿 化 有 关 
的 元 素 : x 一 外 ， = 销 ; 一 网 ， 加 一 略 , 一 顾 = 
砷 。 并 计算 得 它们 的 相关 系数 矩阵 


过 1 3 如 了 4 ry bl 


ms |0.8462 1 

x |0.7579 0.9802 1 

x | 0.6431 0.2419 0.1811 1 

wy (0.5039 0.7370 0.7210 一 03075 1 

ws 10.5603 0.4241 6.3930 0.1998 0.6802 1 


其 中 ri 一 zi 一 1,2, +，€。 试 用 系统 聚 类 的 县 小 距离 法 对 六 
个 变量 进行 聚 类 ( 负 相 关系 数 末 用 绝对 值 )。 
下 于 采用 的 是 相关 系数 矩阵 ,所 以 应 找 最 大 元 于 六 类 ,在 有 Rw 
中 最 大 元 误 为 有 :一 0.39802， 因 此 将 wx， 与 到 合并 为 本 一 
{x，x} 一 {xX2}， 计 算 与 其 它 剩 下 的 类 的 相关 系数 
Ri ~ min{ Rs, Rn} = min{0.7579, 0.8462} 一 0.7579, 
Ra = min{R,,, Rs} — min{0.1811,0.2419} 一 0.1811 
Rys™—™— min{R,,ss Res = min{0.7210,0.7370} 一 0.7210 
Ry 一 min{ Rs Raa} — min{0.3930,0.4241} 一 0.3930 
相应 地 可 得 到 Riy: 


"4B a 


wy bd Th Wy 和 


wy 1 
xl | 0.7579 1 
Roy wx, | 0.1811 0.5431 1 


zs 10.7210 0.5039 |—0.3075| 1 
x A0.3930 0.5603 -0.1998 0.6802. 1 


从 Ri 中 找 最 大 的 元 于 Rs™= 0.7579， 合并 1s HF 特 
{= =} {xrs x 2} …: 如 此 进行 下 去 ， 最 后 将 六 个 变量 侣 并 为 
一 个 类 ， 详 细 的 合并 过 程 列 在 表 2.2 中 。 并 且 可 夯 出 谱系 图 (图 


表 2.2 六 个 变量 的 并 类 顺 席 表 


合并 次 序 | 全 合并 后 的 闫 的 元 过 (全 并 来 委 、 
1 wy {Fs 0.9802 
2 sy = {sts 1} 0.7579 
.和 Ry om {re) 04.6802 
4 1 EE 五 89 和 人 让 3 
要 | Wi aa {Ts 放心 7 


.0 0,.B 0,.6 必 和 .2 
| 


而 ( 档 》 
a《 铜 ) 
x 局 ) 
,st 乔 ) 
| x 如 } 
zu 居 } 


图 2.2 六 沾 元 案 的 谱系 图 
2.23, 横 举 标 是 并 类 的 相关 系数 、 
由 上 述 例 于 容易 看 出 ， 计算 新 关 与 其 它 关 的 虐 离 时 ,可 用 如 下 
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的 递 推 公 式 ; 
Dr™ min{D,,,, Dy (2.6) 
其 中 D, 表示 新 类 一 (由 类 rm， 合并 的 新 类 ) 与 类 ww 的 中 
离 ，D,,x， Do 分 别 表 示 类 rw， 与 类 x 的 好 离 。 
2” 最 大 配 离 法 。 
最 大 距离 法 的 计算 过 程 与 最 小 距离 法 是 一 样 的 ， 只 是 在 计算 
类 与 类 的 距离 时 采用 C2.2) 式 . 
便 2.3 将 贫 2.1 中 的 五 个 磁 按 最 大 更 离 法 进行 系统 桶 类 ， 
合并 的 过 程 在 这 里 就 不 获 述 ， 只 招 并 类 的 顺序 列 于 表 2.3 并 
画 出 相应 谱系 图 2.3. 
这 2.3 五 个 样品 点 最 大 距离 法 的 合并 闫 序 


合并 后 类 中 的 元 察 。 ”| 合并 水 平 (距离) 


We = {x9} I 
Ty #1} i 


Ta mm a 3 


Ne or {mT Ean Ta} EU 


图 ?2.3 五 个 样品 的 最 大 距离 法 庶 系 图 


最 大 距离 法 同样 可 进行 衣 型 聚 类 。 在 计算 新 类 x 《由 类 = 
和 类 x 合并 的 新 类 ) 与 其 它 类 x 的 了 虐 离 时 ,同样 有 递 推 公式 : 
Di = max{Dp,is Det} (2.7) 
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3? 重心 距 窗 法 

由 手 类 与 类 之 间 的 醋 离 是 由 两 类 中心 的 距 京 来 定义 ,开始 时 ， 
# 个 类 之 闻 的 距离 都 是 样 总 之 间 的 降 离 ， 随 着 类 的 合并 新 类 的 重 
心 就 要 重新 计算 ， 因 此 先导 出 重心 法 类 间距 离 的 递 推 公式 是 方便 
的 。 如 果 某 一 步 类 =， 与 类 x 各 有 加 和 m 个 样 晤 、 其 重心 
分 别 为 f 与 大,， 它 们 合并 成 新 类 二 ， 炭 有 内 有 本 一声 
十 za 个 样品 ,其 重心 为 过 ， 显 然 


史 一 了 (ze 天 十 如 是 )。 


琳 用 网 氏 距 离 我 们 来 算 x 与 其 它 任意 类 x+ 的 工 离 平 方 ， 邵 计 
算 xz 的 重心 名 与 x 的 重心 的 距离 平方 。 


Di, 一 d(T, ) = (TR 元 了 (元 一 元 


es | 一 一 1 (np 二 | ja 一 二 (nsx 十 oa)] 
Br ” 
, Hy . #y 上 
4 是 一 2 nm i 一 2 


十 六 [az 天 让， 十 27p1 天 元 ， 十 3 大 之 ，] 


_， 1 
利用 二 一 > EE 


一 列强 


， 3 

部 ? Bg 4 fp Tip beitp 
一 宇 一 - -人 

Re ?yr a 。 


则 有 
ny ， 
Wd " 站 一 
二 二 (ER 一 2 天 ， 十 元 


pg ” 
区 (于 p 于 ,一 2 是 ?到 十 Xe) 


i 


了 


np me 
二 Di 一 Di (2.8) 
(2.8) 式 就 是 采用 欣 儿 距离 计算 的 类 间 重 心 蝶 离 的 递 推 公式 ， 
例 2.4 将 例 2.1 中 的 5 个 补品 用 重心 法 进行 聚 类 。 
将 例 2.1 中 的 距离 系数 扼 阵 Dw， 中 的 元 素平 方 并 记 为 Di 


RE NI RE Fy Hy 
x /0 
x [16 0 
Diy= rx, 135 31 0 
xa 1 49 100 Oo 
ws \36 9 25 64 自 


在 DD 中 元 素 Da。 一 1 最 小 , 即 亚 19 Ty 最 相似, 合并 它们 为 
me 并 mi {rs Xa}s 计算 Ne 与 ys 的 类 重心 距离 ， 此 
时 只 须 按 递 推 公式 42.82 计 算 , 这 里 Bs 2 


Di 一 二 Dh 二 卫 Di 一 让 Di 
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一 上 XI16 土 工 X49 一 工 X1 一 32.25 
2 2 4 
了 Di 一 — Dit Di 可 ta 


~ lx36+1ixi0— + x1 67.75 
2 2 4 


Di — 二 D 和 5 十 二 更 一 让 2 
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一 土 X36 十 工 X64 一 江 X1 一 49. 和 5 
2 2 4 


从 而 得到 DiD: 
“52 。 


费 。 证 玫 ， 是 
本 从 
Di ~ 32.25 0 
x, | 67.75 81 0 
rs 49.75 9 25 0 
从 六, 出 发 重复 上 述 的 过 程 直 至 五 个 样品 妇 为 一 个 类 ， 其 合并 
过 程 由 表 2.4 所 示 。 


囊 2-4 玉 个 样品 点 年 心 法 的 合并 顺序 


1 T1 EA my 一 {xa} 1 
人 时 Hy = {ry bE 
3 EA | 忆 NE = {TT a) 驰 .79 
站 EL | mi Wy ae ls 4 .36 
I - 
同 禅 还 可 商 出 谱系 图， 
4” 类 平均 距离 法 


类 平均 距离 是 采用 公式 【247, 根 据 它 ， 我 们 很 容易 求 得 类 平 
雹 上 距离 的 递 推 公式 为 
Dir 一 二 了 > 41 一 一 一 2 D) de 


| 1 ur Ewn 


Do (2.9) 


Fy FEn, 


利用 C2.9) 我 们 就 可 以 先行 来 类 ,其 过 程 与 前 面 几 种 方法 一 笠 
5? ” 离 差 平方 和 法 
离 盖 平方 和 距离 是 且 用 公式 (2. 裤 , 根据 它 并 用 绽 似 于 重心 蔡 
递 推 公式 的 推导 方法 ， 便 可 以 得 到 离 莽 平 方 和 距离 的 递 推 公式 为 
np 十 T ng 十 2 


生 
2 Be Oo 一 一 -一 -一 一 一 一 一 一 3 
Di 矶 十 候 Dip WB Di, (2.10) 
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利用 (2.10?, 就 可 进行 聚 类 ,其 过 程 也 皇 与 前 商 几 儿 方 法 一 拌 . 

除了 上 述 介绍 的 五 种 系统 聚 交 法 之 外 ,还 有 中 间距 离 荡 、 可 变 
了 社区 及 可 变 类 平均 蕉 (参见 [9]、[17] 或 [22])， 但 这 三 种 方法 实际 
应 用 中 较 少 用 ，1967 年 Lance 和 Wiiliams 给 出 了 合并 前 与 合 
并 后 类 与 类 之 间 的 距离 统一 道 推 公式 ; 

Di, 一 opDi,s + oDis + 8PD3 + riDi, — Dal C2.11) 

其 中 meys8 和 > 对 不 同 的 方法 有 不 同 的 取 值 ,具体 的 育 值 情况 
列 于 表 2.5。 


襟 2.5 信和 种 系统 票 类 法 的 参数 全 


而 法 re B 了 
. ] 1 
最 小 距离 法 3 全 EF 
] 1 时 
重心 法 pin ne, —mpief 0 
闫 平均 法 jn。 jms oo | ， 
窗 莽 平方 和 话 Cnt +t np) Cm 用 一 深交 并 二 王 ， 0 
- Hn + 好 站 了 nn 
1 一 一 
中 国 右 离 法 世 了 4 HS) 4 
可 诡计 {1 一 应) {1 — BY2 < 1 0 


由 于 有 统一 公式 (2.11), 对 编制 计算 机 和 哥 序 提供 了 很 大 的 方便 . 

在 结束 此 段 之 前 ， 我 们 再 举 一 个 如 型 系统 到 类 方法 的 实际 应 
用 例 于 . 

例 2.5 在 将 敬酒 的 质量 评比 中 ,由 品 酒 专家 分 别 对 每 种 酒 的 
色香 、 味 、 甜 度 等 十 项 指 款 进行 打分 (10 分 为 满分 }, 现 有 12 种 
酒 ,对 每 种 酒 取 25 次 桩 ,分 别 进行 打分 ， 然 后 取 平 均值 ,得 到 每 种 
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-家 2.6 十 二 种 葡 葡 酒 得 分 数据 表 


酒 的 每 项 指标 的 平均 得 分 数据 ( 表 2.6 所 示 ). 
按 最 小 距离 法 合并 的 顺序 列 于 表 2.7。 其 谱系 图 为 图 2.4 所 
AA。 
从 图 2.4 可 以 看 而 ,如 果 我 们 取 合 并 水 平 为 3.00， 那 么 十 二 种 
酒 可 以 分 为 三 类 ,第 一 类 为 {1 ;2}， 第 二 类 为 13,4,5,7,8,11 :6}, 
第 三 类 为 《9,12,10)。 如 果 我 们 把 每 种 酒 的 十 项 指标 的 得 分 再 作 
一 次 平均 ,可 以 看 到 第 一 类 酒 的 评分 低 于 50 分 ， 第 二 类 酒 的 评分 
几乎 都 在 60 分 上 下 ,而 第 三 类 酒 的 评分 在 35.0~5.3 分 之 间 , 所 以 
第 一 类 酒 最 差 , 第 三 类 酒 较 茎 ,第 二 类 酒 是 好 酒 。 用 这 种 情 类 方法 
对 酒 进行 评价 是 合理 的 ， 加 果 月 离 差 平方 和 法 或 者 重心 法 ， 仍 按 
三 类 划分 ,其 结果 与 最 小 距离 法 是 一 致 的 。 
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表 2.7 十 二 种 戎 菊 洋 最 小 扎 元 法 的 合并 顺序 


合并 次 序 | 。 合并 的 关 语 并 后 类 中 的 元 素 合并 虐 宛 


] -A= 4, 5} 
2 204 一 A7s8} 
3 1s = {0,12} 


4 x ™— 78,11} 
5 mr = {4798,11 4, 


Tr {78,1l 435} 


6 

7 一 {9,12,10} 
8 一 《1152 
Ed 


x = 711463} 


10 ma 一 {181,456, 353,912,10} 


1 1 一 {17381194555653o9o12540>1>2} 


图 2.4 十 二 种 葡 荷 酒 最 小 虑 高 法 谱系 图 
人 《二 ) 分 解 春 类 法 ~ 
_ 感 本 恨 介 绍 将 类 由 少 变 到 多 的 分 解 集 类 法 。 一 开始 是 把 全 部 个 
体 当 作 一 类 ,然后 再 分 为 两 类 ,三 类 ,…, 直 至 所 有 的 个 体 自 成 一 类 
为 止 。 在 这 里 我 们 只 介绍 一 种 "一 分 为 二 "的 方法 ， 
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设 有 = 个 样品 当 作 一 类 记 为 =*， 将 它 分 为 两 个 子 类 一 和 
且 各 有 和 7 个 样品 , 记 zwei 的 重心 为 芋 , 元 和 元 ， “一 
分 为 二 "的 思想 方法 与 上 (一 ) 眉 中 Ward 提出 的 离 盖 平方 和 距离 
的 思想 是 一 致 的 , 即 方差 分 析 的 思想 。 类 ,=1,*， 的 离 差 平方 和 
为 


一 5) (Cx; 一 下] 人 (3 一半} {2.12) 
Si— (xi— Ew RE) i—1,2, (2.13) 


如 果 交 x 和 x 分 得 合理 ,应 使 得 S 十 5, 尽 可 能 小 ， 或 者 说 使 
5 一 5, 一 5， 尽 可 能 大 。 容 易 证 明 : - 


五 一 和 一 人 一 字 一 Ti (Fs — EL) CR — Ra) C2.14) 
事实 上 ,由 于 
So SY) (xO— Rr 一 元 ) > x 一 9 是 
[二 


5 > (xj — FF) Cx 一 者 


一 人 Mi 一 nj 了 ;一 12， 
注意 到 一 内 十 本， 下 >) XX 呈 >) Xnxn 十 >) xnxn; 因 此 
EET t=1 Pe . 
有 - 和 1 
百 一 -一 3 一 中 一 牛头 元 十 1 天 元 一 7## 殉 芋 (2.15) 
将 关系 式 z 量 一 my 至 十 4 名 的 两 边 “ 衬 方 ” ,得 


站 芝 乱 2 C2.167 
而 2 着 声 一 站 元 十 元 雹 一 【天 一 狐 )( 玉 一 二 } 
将 它 代 人 (2.16) 得 ”了 


一 
从) 加 2 涉 庆 ， 一 让 ,信芳 一 天,) 


本 有 ar 
下 二 一 去 天 :元 | 十 2 Er 一 3 {fF 一 于》 (FE 一 二) 
得 


并 将 它 代入 (2.15) 式 便 得 天 (2.14) 式 ， 

我 们 用 EB 一 5 一 8 一 5, 作为 目标 范 数 ,选择 其 种 分 法 使 
达到 最 大 , # 个 样品 分 成 二 类 ,一 奢 可 能 的 分 法 有 《2"! 一 1) 种 ， 
当 # 稍 大 时 要 比较 如 此 多 的 分 类 ,工作 售 十 分 大 ,于 是 内 好 放弃 求 
精确 最 优 解 , 而 去 求 局 部 最 忧 解 。 具 体 做 法 如 下 ; 

一 开始 所 有 ” 个 样品 均 在 x， 中 ， 然 局 找 一 个 样品 把 它 归 入 
x， 使 E 达 到 最 大 ,接着 稍 找 第 二 个 样品 归 和 人 x, 使 互 达 到 最 大 ， 
如 此 继续 下 去 (注意 : 茶 样 号 一 旦 归 和 人 x 后 ,该 样品 在 以 后 的 划 . 
分 中 就 不 再 回 到 =)， 

令 EC1), C2),-…、ECK) 表示 x， 中 有 一 个 祥 品 ， 二 个 样 
品 ,…, 个 样品 的 E 信 ,那么 一 定 存 在 ix* 使 得 

ER*)— max E(k). 
2] . 
于 是 将 前 丸 次 进入 zw 的 样品 归 为 一 类 ， 其 余 4 一 在 个 样品 
为 另 一 类 ， 这 样 就 把 一 个 烽 分 为 两 个 类 。 再 将 上 述 的 步骤 应 用 于 
子 类 直至 每 个 样品 都 自 成 一 灼 。 

例 2.6 宕 2.8 给 岂 了 5 个 样品 的 两 个 变量 的 测量 数据 ,试用 
“一 分 为 二 "的 方法 进行 聚 类 、 

衣 2.8 闪 个 样品 的 观测 数据 


开始 将 六 个 样品 组 成 一 类 为 襟 人 将 
» 3 » 


x 从 zi 划 人 x 中 ,相应 的 是 标 基 数值 为 
Ew (EE 3 一 1 一 
元 ) 人 ) 6 [ei eo) 


(1+ 256) ~ 2.97 
将 x 从 xp : 划 入 zj 中 ,相应 的 目标 函数 值 为 
26 一 6 [2.6 一 6 
三 6 (solliis_ sl. 
一 C156 二 7.84) 一 16.17 . 


类 似 地 将 zx, x; x 分 别 划 到 x 如 中 ,相应 的 目标 函数 值 为 
28.17,14.17,6.57,4.17 ,其 中 最 大 的 E 值 是 28.17 , 即 得 到 瑟 (1) 一 
28.17， 这 样 就 将 x， 归 人 zx 人， 于 是 得 到 两 类 为 xi 一 {x, 入 ， 
一 {zj， 此 时 将 x， 固定 在 wi? 中 ,再 重复 上 述 的 
步 孤 , 即 从 xi? 中 分 别 将 交加 :区 上 划 和 人 x 中 计算 相应 
的 目标 函数 值 为 8.17，1.42，51.42，23.67，9.67。 显然 最 天 者 为 
51.42， 它 是 将 x， 划 入 #3 的 只 称 函 数值 ， 即 此 时 E42) 一 
51.42， 于 是 得 到 王 姜 : x 让 一 {xx 一 {2 0} 从 
ri 和 x 四 出 发 继续 做 下 去 ,类 似 的 结果 列 在 表 2.9 中 。 
下 2.9 对 六 个 样品 第 一 分 解 过 程 的 数据 


天 4 5 
划 员 欧 样 品 x xz 
ECk) 21-63 二 .17 


从 表 2.9 中 可 以 看 出 ECR*) 一 C2) 一 ,max ER)， 因 此 对 大 个 
样品 第 一 次 分 解 的 结果 为 : 


wi {Te ss Tels a {Xs 
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EC2) 一 51.42 看 作 第 一 次 分 解 的 距离 水 平 , 记 为 EEC1). 

将 第 一 次 分 解 缚 果 的 欧 个 类 分 别 进 行 “ 一 分 为 二 ”。 一 
{xtyxayxssxili“ 一 分 为 二 "的 结 取 是 : 

mi Wx) mi {x xe} 
英 相 应 的 E 值 为 4.23， 有 而 zw 一 [xs] 一 分 为 二 的 结果 是 {%}， 
{x， 其 相应 的 瑟 值 为 1。 显然 4.23 盖 1， 此 时 在 水 平 EE (2) 
一 4.23 上 应 分 为 三 类 ;: 
sm {x sr 一 fm 一 本 一 To 

上 面 的 三 类 便 是 第 二 次 兮 解 的 结果 。 

将 第 二 次 分 解 的 三 个 类 又 进行 一 分 为 二 ,其 结果 分 别 为 ; 
x 分 为 [xi],{xs}， 其 8 值 为 1 
zo 分 为 { 罗 xl， 其 五 信 为 2.5 
x 分 为 车 { 二 }， 其 五 信 为 工 

显然 2.5 最 大 ,此 时 在 水 平 EE(3) 一 2.5 上 应 分 为 四 类 ; 

z= {x}, a = {x x = {el}, 2 一 {x 
再 将 中 与 x 分 别 进 行 一 分 为 二 , 且 王 值 痢 为 1, 最 后 在 水 平 
BE(42> 一 工 上 将 六 个 样品 全 部 分 解 完 单 ， 轨 据 EEC1), EEC2)， 
EE(3),EE(4》 短 为 分 解 时 的 水 平 (或 者 用 它们 的 平方 根 ) 便 可 画 
而 谱系 图 (如 图 2.5 所 示 )。 


1 2 3 和 4 5 丰 了 8 《 互 导 的 平方 视 》 


图 3.5 六 个 样 曲 分 解法 庄 系 时 


a 360 + 


《三 》 类 的 定义 及 系统 聚 类 的 性 质 

在 不 同 的 领域 中 类 的 含 多 是 不 尽 相同 的 ， 要 给 出 一 个 严格 的 
统一 定义 是 不 容易 的 。 Rao 1977 年 曾 给 出 三 种 定义 法 . . 

定义 2.1 设 有 是 给 定 的 下 数 , 对 于 集合 5 中 任 二 个 元 素 的 距 
离 dj;; 有 : 
di Sh (ije dy 
称 对 于 请 值 括 组 成 一 个 类。 

定义 2.2 设 关 是 给 定 的 正 数 ,对 于 集合 s 中 元 索 的 上 距离 时 
满足 


其 中 站 为 3 中 的 元 素 个 数 。 称 5 对 于 阐 值 让 组 成 一 个 类 。 

定义 2.3 设 上 和 扩 >8#) 是 给 定 两 个 正 数 , 3 中 元 索 的 上 路 离 

dii 祷 足 
RED 2 总 < 
其 中 不 为 3 中 元 案 的 个 数 , 称 5 对 于 阅 值 %、r 组 成 一 个 类 ， 

类 似 地 还 可 给 出 如 下 两 个 定义 。 

定 尖 2.4 给 定之 0， 沼 合 5 中 元 素 的 距离 页 满足 : 对 
于 和 伍 一 个 i€ 3， 存在 某 个 ji63， 使 得 邮 生 5 称 5 对 于 阅 值 
下 组 成 一 个 类 。 - 

定 交 2.5 给 定 天 > 6， 将 集合 5 任意 分 成 黄 类 5 和 名, 这 

两 类 之 疗 工 离 DC 43) 满足 : DOS 5) 安 站 称 3 对 于 阔 介 再 
组 成 一 类 ， 

在 (一 ) 妥 中 表 【2.57 谷 册 了 类 与 英之 问 的 八 种 距 高 及 其 地 推 
公式 (2.11), 类 的 定义 2.5 中 D(C5, 3) 可 用 八 种 距离 法 的 侍 一 种 
《也 可 用 于 分 解法 ), 定义 2.1 可 用 于 最 天 距离 法 , 定义 2.4 可 用 于 
最 小 了 距离 法 ,定义 22 可 用 于 类 平 询 蔡 。 

在 通常 的 情况 下 ,不 可 能 确定 出 一 个 " 景 优 "的 聚 类 过 程 , 于 是 
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大 们 提出 一 者 容许 案 尖 过 程 ， 令 4 表示 某 种 在 一 般 情 况 或 者 在 熏 
有 特殊 应 用 范围 内 的 任何 合理 的 购 类 过 程 中 均 能 得 到 策 足 的 已 
质 。 如 果 一 个 误 类 过 程 是 满足 条 件 4 的， 我 们 称 该 聚 类 过 程 《 方 
靶 ) 是 4 容许 的 (或 者 称 该 过 程 具 有 性 质 4). 1971 年 L. Fisher 
和 了 W.Vanness 较 详 细 的 讨论 了 聚 类 的 容许 问题 , 有 兴趣 的 读 
者 可 参看 [27]。 在 这 里 我 们 只 介绍 单调 性 . 浓 第 与 扩张 .最 小 支 泉 
树 结构 及 最 饥 下-KK 分 类 等 性 质 。 
【《I7 单调 性 

系统 聚 类 读 一 开始 各 样品 自 成 一 类 ,将 距离 最 近 的 两 类 合并 ， 
这 两 类 距离 记 为 Zr， 第 二 次 合并 的 最 近 二 类 的 想 离 为 D,,*………， 
如 果 Di 专 DD, 万，… ,由 称 该 系统 率 类 法 具有 单调 性 .最 小 距离 法 
是 具有 单调 些 的 ,事实 上 , 某 次 把 x， 和 =。 类 合并 为 x, 于， 则 
rr 与 其 它 类 x 的 西 离 是 

Di:™= min{D,.4, Dei} 

设 下 一 次 并 类 欧西 离 为 D,,， 如果 sris 拓 rr， 则 必 有 D,, 守 
刀 ,,，， 否 则 上 一 次 就 应 台 并 <， 和 r, 如 果 s,: 有 一 个 等 于 r， 
不 妨 设 + 一 +， 则 六 .一 min{tD Do . 无论 DD, 是 等 于 DD,, 
D,, 的 哪 一 个 ， 都 有 Di 之 D,,,， 所 以 下 次 的 并 类 距离 Di 不 
小 于 上 次 并 类 的 距离 D,.,。 这 就 证 明了 最 小 虐 高 法 具有 单调 性 ， 
可 以 证 月 量 大 距离 法 , 离 差 平方 和 距离 法 ， 可 变法 ,可 变 类 平均 潜 
以 及 类 平均 法 也 都 具有 单调 性 ,而 重心 距离 法 刚 没有 单调 狂 。 

(2) 空间 的 浓缩 与 扩张 . 

例 2.1 与 例 23 分 别 是 对 尊 样 的 五 个 样品 用 最 小 虹 离 法 和 最 
大 工 离 靶 进 行 琶 ， 它 们 谱系 图 分 别 为 图 2.1 和 图 2.3, 图 中 的 横 坐 
标的 范 惫 相 壮 了 一 倍 . : 而 分 类 水 平 范 围 小 的 方法 区 别 娄 的 灵敏 度 
差 ,但 水 平 范围 志 大 的 方法 ,灵敏 度 过 商会 使 没有 显著 差异 变 成 有 
显著 凌 蜡 ,而 归 人 不 同 的 类 。 因 此 灵敏 度 太 低 或 太 嵩 都 不 好 ,要 适 
中 为 好 ， 从 这 一 直观 想法 引进 空间 的 演 缩 与 扩 张 的 概念 ， 

设 4 = Can) 与 B 一 《bi) 是 两 个 元 泰 非 负 的 同 阶 矩 阵 , 若 
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or 宇 by 《任意 的 闷 力 ， 则 记 6《4) 之 ECB)《 请 不 要 与 非 负 定 
甜 阵 4 之 B 混淆 ), 用 记号 4 (4) 守 0 表示 4 中 的 元 素 非 负 。 

定义 2.6 设 1,11 为 两 个 系统 聚 英 靶 , 在 第 i 次 合并 时 相应 
的 下 离 矩阵 记 为 Di(D 和 mi(D 各 一 0，1，……， + 一 1), 车 
FDAD) > SCD AID) CG — 00,1, 1), 则 称 1 比 I 工 护 张 
或 开 比 1 浓缩 . 

我 们 用 DP (小),，D (大 )，D〔 平 )，… 表 示 最 小 距离 法 ,最 
大 距离 法 ,关乎 均 法 … 合 并 类 时 相 立 的 距离 矩阵 ,我 们 以 类 平均 法 
为 基准 可 以 证 明 (参看 [9]). 

FD CM) EGD (FN) EED (A)) 
FCD ( 重 )) 所 ia(D( 平 )) 孝 4(D( 离 ). 

由 此 看 出 类 平 询 法 不 太 扩 张 也 不 太 浓缩， 

交 3) 最 小 支撑 树 结构 

我 们 把 # 个 样品 视 为 ? 维 空间 中 的 = 个 点 ， 点 与 点 之 间 可 用 
一 些 边 来 联结 ,就 构成 ? 维 空间 中 的 图 ， 因 此 ,自然 想到 图 论 中 的 
最 小 支撑 树 这 个 有 用 的 工具 ， 在 这 里 我 们 着 重地 讨论 最 小 距离 法 
与 最 小 支撑 树 的 关系 ， 

设 P 维 空间 有 # 个 点 ,点 与 点 之 间 定义 了 距离 ds， 任 两 点 的 
联 线 称 为 边 ,两 点 疗 的 距离 称 为 边 的 长 度 . 

定义 2.7 两 点 之 间 通 过 一 系列 的 边 联系 起 来 ， 这 些 边 称 为 
链 , 一 个 链 如 果 是 封闭 的 , 则 称 这 个 链 组 成 一 个 回路 . 
定义 2.8 = 个 点 之 间 都 有 链 互 相 联结 , 则 称 这 些 点 和 链 组 成 
了 一 个 联接 图 ,没有 回路 的 联接 图 称 为 糙 , 如 果树 包含 了 原 联 接 图 
的 所 有 点 , 称 这 个 树 为 联接 图 的 支撑 树 ， 

定义 2.9 ” 椅 的 所 有 边 的 长 度 之 和 叫做 树 的 重量 ,在 联接 图 中 
具有 最 小 重量 的 支撑 树 称 为 最 小 支撑 树 , 简 记 为 MST. 

设 将 4# 个 点 分 成 两 组 非 空 而 又 不 相交 的 子 集 <, 和 w,， 见 
zp 和 re 是 # 个 点 的 一 个 划分 ,用 (2.1) 式 定义 x*。 和 x， 的 中 
离 , 即 
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令 CCryzs) 袁 示 联结 <, 和 ws 的 一 切 边 的 集合 ， 并 称 它 为 
zy， re 的 载 集 ， 在 CC,，zmy) 中 达到 极 小 D,.。 的 边 的 集合 
记 作 和 

最 小 支撑 树 是 十 分 有 用 的 ,例如 基 一 城市 有 = 个 居民 点 ,要 建 
造 道 略 把 这 ?个 居民 点 连通 , 设 道路 的 造价 正比 于 道路 长 , 问 应 如 
何 修 造 最 合算 ? 它 的 解 正 是 构造 最 小 支撑 梯 。 

为 了 方便 ,不 妨 设 ?个 点 的 任 二 点 的 距离 不 等 ， 事 实 上 若 相 
等 ,只 须 其 中 某 边 稍微 增 减 一 点 长 度 不 会 影响 最 小 支撑 向 的 计算 ， 
在 这 个 假设 下 .2(x ,x。) 是 玲 一 的 ， 

定理 2.1 设 空间 ”个 点 组 成 集合 x ， 风 有 

i) 树 的 尾 一 这 除去 后 《不 包括 端点 )， 那 么 分 离 成 的 二 部 分 
yy xy 梅 成 的 一 个 划分 ,如 补 上 CC=，，=，) 的 性 一 其 它 边 ， 
构成 新 的 树 . 

让 ) 树 只 有 = 一 1 条 边 , 且 它 的 全 一 子 集 不 构成 回路 ,而 把 年 
一 条 不 属于 树 的 边 加 上 去 ,一 定形 成 菜 一 回路。 

ii) = 中 任意 * 一 1 条 不 构成 回路 的 联结 图 构成 一 树 ， 

iv) = 中 的 任 一 划分 <。，xo， 则 XCxp,x4s) 一 定 属于 = 的 
MST. 

Y) 中 的 尾 一 划分 x ,，“o。， 如果 对 于 <， 的 任 一 子 划 分 
pr po 有 Dy p, < Dyes 出 rp 的 MST 是 x 的 MST 的 子 
集 ， 

证 明 : i) ~ iii)》 是 显然 的 。 下 面 证 明 iy》 和 ). 设 4(x，， 
xe)EMST， 则 MST 一 定 有 C(x yp,xs) 中 某 一 边 ,根据 i》 我 们 
将 4Cx。，xs》 代替 该 边 得 到 新 嵌 T+， 则 T* 的 重 景 比 MST 
轻 , 得 出 饿 盾 这 样 便 证 明了 iv). 设 某 边 ex， 的 MST， 则 去 掉 该 
边 形成 xy 的 一 个 划分 x pyx ps 由 iv) 知 该 边 一 2Czp,， xp)， 又 
由 于 Di 一 min(D ery De) 三 Dis， 由 条 件 Di < Dyws 故 
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Dy, 之 DD 这 说 明 zy 与 x 一 rp 一 x， 的 耻 离 太一 
minCDop,ps Dyasg) = Dpspe WM hp rp) Ax, sr iv) 
知 后 者 属于 z 的 MST。 即 x, 的 MST 是 = 的 MST 的 子 集 。 
这 样 便 证 明了 v)。 

Kruskal 在 1956 年 提出 了 下 人 列 求 最 小 支撑 树 的 算法 ; 

设 连 结 < 中 和 任 二 点 的 边 的 全 体 记 为 C (x)， 显然 共有 zt 
一 1)12 条 . 

i 选取 C(x 》 中 具有 最 小 长 度 的 边 na， 记 Si 呈 {}， 

i 在 Cx) 一 5 中 选取 最 小 长 度 的 过 5, 记 3 一 1， 
1} 

iii》 设 已 选 好 了 SS 是， 从 CCz) 一 5 中选 
取 5 使 其 满足 SUln 不 含 回路 ,同时 bin 着 Cr 一 六 中 
最 小 长 度 的 边 . 

iy) 重复 iii) 的 作法 直到 选 刀 1， 从 和 而 560 一 1， 

“la) 构成 < 的 MST。 

定理 2.2 当中 的 边 长 两 两 不 等 时 按 Kruskal 算 话 求 则 的 
树 是 x 的 唯一 MST. 

此 定 苇 的 证 明 风 [28], 

下 面 我 们 讨论 最 小 距离 系统 聚 类 法 共有 最 小 支撑 娃 结 构 。 

定理 23 设 *# 个 样品 福 为 了 维 空间 中 的 # 个 点 , 且 它 们 商 黄 
之 闻 的 距离 互 不 相等 , 则 在 最 小 工 离 法 中 第 1 所 i 所 # 一 1) 步 
合并 的 两 类 正 是 Kruskal 法 中 第 ; ; 步 取 出 的 1， 所 连结 的 两 类 ， 
并 且 此 时 所 有 分 类 和 多， 名 各自 的 MST 是 二 的 MST 的 
子 集 . 

证 明 ， 景 小 距离 法 守 类 的 第 一 步 是 将 # 个 点 距离 最 短 的 二 点 
妇 为 一 类 正 是 Kruskal 法 中 取 几 最 小 长 度 的 过 8， 而 业 py Ta 
的 距离 正 是 Dp,e 一 min 。 (2)， 把 ya， 合并 时 , 实质 上 相应 
于 取出 边 4Cx ,rs)， 从 而 每 一 次 把 二 类 合并 的 豪 类 过 程 可 以 看 
成 及 Ca 中 选 出 一 条 边 , 经 过 +# 一 1 次 束 类 并 成 一 类 则 相当 
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于 构成 了 = 中 的 其 一 支撑 糙 ， 用 归纳 法 ， 设 按 基 小 虐 离 法 前 第 ; 
次 并 类 相当 于 Kruskal 潜 中 取出 了 万 ， 则 第 工 七 1 次 并 类 时 是 
从 宗 下 的 二 一 次， 记 为 < 扣 扩 人 中 取出 距离 最 小 的 
二 类 合并 ,或 者 说 从 所 有 XCx 信 ,x 人 和 1 
一 他 中 选取 最 短 者 [， 由 最 小 距离 法 的 单 议 性 知 了 > 这-…- 
> 上 而 了 正 是 Kruskal 法 中 的 Lint， 从 而 按 最 小 距离 法 记 业 
正 是 求 = 中 MST 的 过 程 ， 下 面 仍 利用 归纳 靶 来 证 明 第 二 个 结 
论 , 当 站 一 1 时 , 仅 育 五 而 且 是 # 中 最 短 的 边 , 所 以 是 x 的 MST 
的 子 集 ， 设 第 诗 步 得 到 的 类 zx 外， …'，z 训 ;的 MST 是 x 的 
MST 的 子 集 汐 真 ,当主 十 1 时 , x 了 7 mm 1 2 一 了 一 1 中 
除了 由 24， 连结 的 奖 内，= 史 之 外 ， 其 它 的 类 都 与 x 六 (j 大 
1 所 :一样 ,因此 只 须 证 明 x 人 Ux 中 的 MST 也 是 = 的 MST 
的 子 集 凶 可。 由 于 x 信 Ux 从 的 任 一 个 划分 P 与 89 必 有 Dp 所 
fitls 而 (x Ur ) 与 Cx ~ 区 后 一 天 全 的 距离 是 大 于 Lins 
由 定理 2.1 的 让 知 x 由 Ux 的 MST 必 为 * 的 MS5T 的 子 集 目 

4) 最 优 厂 - 及 分 类 

没有 # 个 样品 ,和 合 分 成 下 类 , 设 Px 一 {x1,"…*, xx} 是 枉 一 
种 分 法 ,如 果 能 定义 一 个 分 类 的 澡 差 范 数 邢 CPx)， 若 WC(*) 越 
小 表示 分 类 直 合 理 , 因 此 我 们 希望 找到 一 个 分 法 P* 使 得 

| WPD ™ min WCPx) (2.17) 


其 中 .了 kk 是 一 雪 Px 的 侍 合 , 则 称 PR 是 最 优 人 W-KK 分 类 (在 
误差 明 数 WCPzx) 的 意义 下 》, 误差 函数 征 的 定义 有 多 种 多 样 。 这 
里 仅 讨 论 用 类 的 MST 的 最 天边 长 来 定义 的 误差 函数 。 
设 将 #4 个 样品 分 成 天 奖 ，xz1;-"…，xx， 定 义 天 的 直径 RR 
一 Rxj) 为 zx; 的 MST 的 最 大 过 长 ,定义 分 类 的 误差 函数 为 
WOxis*** rg) 一 max RCxri) (2.18) 


定理 2.4 在 定理 2.3 的 假设 下 ,对 一 切 KO 志 K 志 4 一 1) 
用 最 短 距 离 法 得 到 的 天 个 类 xz 区 ,x 人 是 在 C2.18) 的 意 
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浆 下 的 唯一 WW- 六 分 类 。 

证 明 ”用 最 小 距离 法 , 经 过 ”一 天 次 分 类 ， 就 得 到 天 个 类 ; 
x 由 定理 2.3 知道 它们 的 MST 是 x (x 个 样 
此 组 成 ) 的 MST 的 于 集 ， 所 以 有 


Wrt ,a ) 一 max ROP) Lr 
1 号 必 


令 x "Axk 是 本 一 个 KK 分类， 内 须 证 明 Cris***， zx) 空 
1._x 即 可 。 由 最 小 距离 流 知 zx1" 中, ,zx 呈 人 Y 尾 二 类 问 距 离 最 
小 是 K+ 而 {zr} 与 {zr Ke eK} 不 一 样 ， 
则 必 存 在 某 一 个 xi(1 所 i 所 人 ) 它 至 少 包含 了 {xP 侣 ,i 一 1,2， 
-…, 关 } 中 商 个 类 的 其 些 元 索 ， 不 妨 设 x; 包含 了 元 素 x 与 y， 
其 中 x Ex 下 ,yyE x RE 从。 因为 rf 人 与 x/ 的 焉 
离 不 小 于 i_xn， 故 当 联 结 x 与 y 的 一 团 链 中 , 其 最 大 边 不 小 
于 LN 这 说 明了 RCmwi) Sixt lak, 从 而 开 (rt 
xxr) 之 1,_x。 而 且 上 述 的 过 程 也 就 是 证 明 这 个 解 的 唯一 性 ， | 

从 以 上 的 讨论 ， 可 看 出 最 小 距离 法 是 具有 较 多 的 可 容许 条 件 
( 它 满足 更 多 的 可 容许 条 件 可 参看 [27])、 因 此 ,期 小 距离 法 在 实 
际 应 用 中 很 锌 推崇， 


$ 8.3 动态 聚 类 法 


我 们 在 上 节 中 讨论 了 合并 的 系统 育 类 法 和 分 解法 ,它们 都 有 
一 个 共同 点 ,就 是 样品 一 旦 被 归 刘 基 个 类 后 就 不 再 变 了 ,这 就 要 求 
分 类 的 方法 比较 准确 。 此 外 当 样 品 个 数 较 大 时 ， 相 应 地 计算 量 过 
大 -为 了 弥补 它 的 不 足 , 产 生 了 动态 缚 类 法 ， 它 是 将 样品 粗略 地 先 
分 一 下 类 ， 然 后 再 按照 基 种 原则 进行 修正 ， 直 至 分 类 比较 合理 为 
焉 ,动态 到 类 法 的 过 程 大 致 上 可 由 图 3.1 所 示 . 

图 3.1 框图 的 前 三 个 部 分 都 月 许多 种 方法 ， 这 些 方 法 按 框 图 
进行 组 合 就 会 得 到 不 辐 的 动态 素 类 法 。 我 们 按 前 三 个 息 格 进行 讨 
论 动态 聚 类 , 


FEF +* 


图 3,1 动态 和 美的 框图 表示 


(一 ) 选择 对 点 的 方法 

迹 点 就 是 一 批 具 有 代表 性 的 点 ,是 和 欲 形 成 类 的 中 心 , 它 的 选择 
决定 了 初始 分 类 ,对 最 终 分 类 有 很 大 影响 ， 选 择 时 要 慎重 .选择 育 
点 有 如 下 的 办 法 ， 

1? 经 验 选 送 , 如 果 对 研究 的 对 象 比较 了 解 , 当 据 以 往 的 经 验 
大 体 知道 样品 应 如 何 分 类 ,分 成 几 闫 ( 警 如 玉 类 ), 这 样 就 可 以 将 每 
一 类 选择 一 个 有 代表 性 的 样品 作为 诊 点 ， 

2° 将 = 个 样品 人 为 地 (或 随机 地 ) 分 成 天 类 ， 以 每 类 的 重心 
作为 聚 点 ， 

3 当 样 品 数量 * 很 大 时 ， 先 从 = 个 样品 中 随 桃 好 抽取 一 部 
分 ,将 这 部 分 样品 用 系统 诊 类 法 先进 行 案 关 ( 聚 成 XK 奖 ), 然 后 计算 
各 类 的 重心 作为 豪 点 ， . 

4° 最 小 最 大 原则 ， 设 要 将 ”个 样品 分 成 久 业 ， 先 选择 所 有 
样品 中 相模 最 远 的 两 个 样品 点 xt， 和 %, 为 前 两 个 育 点 。 即 

dx Ki) di, — maxt{d,,} 

然后 选择 第 三 个 聚 点 xi,， 使 得 xi。 与 前 两 个 聚 点 x;,，xi, 的 较 
小 距离 是 所 有 其 余 的 点 与 x),,x;， 的 较 小 距离 中 景 大 的 ， 然 后 控 
同 尝 则 选取 wj,， 选 取 过 程 可 用 递 推 公式 表达 为 ; 

荐 已 经 进 了 7? 个 聚 点 x,，-…，xjy， 则 + 十 1 个 聚 点 违 取 的 
原则 为 


iinf dx sy20 sr 一 1 2 “人 
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按 上 述 原 则 选 到 第 下 个 豪 点 xie 为 目 。 

以 上 四 种 选择 聚 点 的 方法 是 分 类 数目 天 是 事先 固定 好 的 。 以 
下 两 种 方法 对 天 不 事先 固定 。 

5* 人 为 地 先 选 择 一 个 正 数 心 把 所 有 样品 的 重心 作为 第 一 
个 聚 点 ,然后 把 每 个 样品 输入 ,如 果 答 和 的 样品 与 已 确定 的 聚 点 的 
工 离 都 大 于 d。， 则 该 禅 品 作为 一 个 新 的 聚 点 ， 否 则 不 计 ， 一 直 拒 
所 有 样品 输 完 为 止 ， 这 样 便 选 出 了 若干 个 两 两 距离 都 大 于 4 的 案 


”6。 密度 法 。 人 为 地 定 两 个 正 数 由 和 di(d > 在)， 以 每 个 
样品 点 为 球 心 ;以 而 为 半径 。 落 在 该 球 内 的 样品 数 《 不 包括 球 心 
的 祥 品 ) 称 为 该 祥 品 的 密度 。 首 先 选 取 具 有 最 大 密度 的 样品 点 为 
第 一 豪 点 ， 再 选择 具有 次 大 密 庶 的 样品 点 计算 它 与 第 一 启 点 的 距 
离 ， 如 果 距 离 大 于 d,， 该 点 作为 第 二 聚 点 ,否则 取消 。 按 此 法 从 
密度 大 到 小 的 虎 序 旭 下 去 ， 每 一 次 选取 的 素 点 都 必须 和 已 选 好 的 
豪 点 的 距离 大 于 号 。 这 样 恒 得 到 了 若 手 个 两 两 距离 都 大 于 页 的 
聚 成 。 

《二 ) 秆 始 分 类 的 方法 ， 

”有 了 聚 点 后 就 要 进行 初始 分 类 ， 初 始 分 类 也 有 许多 方法 。 当 
然 初 始 分 类 也 可 以 和 选择 聚 点 同时 进行 《如 下 画 要 介绍 的 3°), 世 
可 以 不 要 率 点 直接 进行 初始 分 类 (如 下 面 杰 介绍 的 4°). 

1° 定 习 样品 点 之 间 的 距离 ,每 个 样品 向 最 华 近 的 轩 点 归 类 . 

2° 每 个 聚 点 自 成 一 类 , 样 号 依次 输入 ,每 进 一 个 样品 将 它 归 
入 最 近 的 药 点 的 类 ,并 计算 该 类 的 重心 ,以 这 个 重心 代替 原来 的 桶 
点 ,再 输入 下 一 个 样品 ,并 按 同 样 的 原则 处 再. 

39 先 人 为 地 害 一 个 正 数 4、 选 择 < 一 {xX}， 如 时 x 与 
x 的 距离 di 之 d， 则 把 % 男人 :否则 % 启 成 一 奖 x 
一 {x:}， 当 某 一 步 轮 到 x, 输入 时 ,如 果 已 形成 玉 类 : x1，-…， 
zx， 每 一 类 第 一 次 进去 的 样品 记 作 x,…*，Xins 《显然 二 一 1， 
才 hin di > 4， 则 将 zx， 另 立 新 类 rr ™ {x,}. 
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”此 绪 的 优点 是 速度 似 , 缺 点 是 分 类 的 结果 与 样品 的 次 序 有 关 ， 

前 面 的 类 容易 比 后 面 的 类 收集 到 更 多 的 样品 . 

4 对 样品 中 的 每 个 变量 先 人 为 地 定 一 个 数 df(1 所 ji < 生 的) 
令 x 一 上 zx/dj], 其 中 [x] 表示 不 起 过 x* 的 整数 ,初始 分 类 的 原 
则 是 对 样品 x， 与 x， 归 和 同一 类 当 且 私 当 x 一 x Cj 一 1,2， 
py. 

《三 》 修改 分 类 的 方法 

奸 吕 进行 了 初始 分 类 后 ， 对 于 不合 理 的 分 类 要 进行 判断 和 催 
下 ,这 也 有 许多 方法 ,下 面 我 们 通过 例子 来 介绍 两 囊 方法 ， 

1° 按 批 修改 法 | 

其 计算 步骤 如 下 : 

i 定义 样 营 之 间 的 距离 ， 选 择 一 批 聚 点 (相对 应 于 图 3.1 的 
第 一 个 框 格 ; 选择 聚 点 )- 

i) 将 样 电 按 最 近 豪 点 归 类 (相对 应 于 图 3.1 的 第 二 个 框 格 : 
初始 分 类 )， 

iiiy 计算 每 闫 的 重心 作为 新 的 药 点 。 如 果 新 的 聚 点 与 原来 的 
聚 点 重合 ,修改 过 程 终止 ， 否 则 回 到 ii) 《相对 应 于 图 3.1 的 第 三 
信 框 格 : 屠 改 分 类 ) 

例 3.1 有 从 12 个 不 同 的 地 区 测定 了 人 某 树种 的 平均 发 什 率 C(x) 
和 发 芽 势 Cx,), 其 数据 如 表 3.1, 采用 欧 氏 距离 ,将 这 12 个 地 区 的 
种 子 用 按 批 修改 法 京 为 两 个 类 ， 

i 选择 聚 点 , 榨 经 验 分 为 两 类 ,并 选取 x; 一 (0.688，0.6057 
和 xn 一 《0.777 .0.7237 为 聚 点 。 

ii) 初始 分 类 ,每 个 样品 向 最 灌 近 的 察 点 归 类 ， 左 序 计 算 x，- 
f= 5.12。 与 褒 点 EE 的 距离 ,如 x 与 YX;， itz 的 欧 氏 更 离 
为 


ds — [C0,707 一 0.688Y + C0.385 一 0.605 7 = 0.221 
di = [0.707 — 0.7777 + C0.385 一 0.7237] 生 一 0.345 
由 于 ds < 裤 dinzs 所 以 将 区 归 太 yn 同样 其 余 的 如 法 炮制 、 其 


人 


x 0.877 0 .513 站 ,全 25 0.633 站 ,站 0.777 


1 
1 HH 
1 | 0.713 | 0.353 | 0.635 | 0.465 0.580 0.723 


辣 果 而 在 表 3.2. Gj 于 到 了 初始 分 类 为 ; 
x {x ~ Ney Kis Kis Kus x = {Xs Xs X12}, 
ii) 修改 初始 分 次 ,计算 x 和 = 如 的 重心 , 即 两 个 初始 分 
类 的 样品 点 的 平均 | 
TY COG47 ,0.450), Br = C0.823,0.704Y 
它们 与 原来 的 迹 点 不 同 ,将 重心 站 ,x 各 作为 新 的 缚 点 ， 将 x(i 
二 1,2,… ,12) 逐个 输入 ， 按 有 晨 靠 近 诊 点 归 类 ， 潜 结 困 列 在 表 
3.3。 到 香 到 第 一 次 六 批 修 改 的 两 个 美 ; 
Ti = {Xi ~ Koes Xs Xio}, rd = {x Xs Kn} 
计算 x 中 与 x 六 的 重心 
RD = (0.636,0.433Y, Xi? 一 《0.802 ,0.672 了 
它们 与 站 ,0 不 同 , 将 如， 着” 作为 新 的 聚 点 ,把 xi(i 一 1,2， 
-12) 逐个 输入 , 按 最 靠近 聚 战 皖 类， 其 结果 列 在 者 3.4。 得 到 
丁 第 二 次 按 批 修 改 的 两 个 业 ， 
x {XL ~ Xa Kes Kas Kio} rT {Ry Ky Xs XL sR} 
继续 进行 第 三 次 修改 ,这 次 修改 后 的 分 类 结 时 与 第 二 次 完全 相同 . 
分 类 停止 。 第 三 次 修改 结果 列 许 表 3.5. 因 此 得 到 最 天 的 分 类 
为 : 
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包 冰 次 科 六 宇 嵌 于 四 圭 Zz1 5 举 


FOO EO 


TE DO SLi 0 | ZE 0 ZOE OF SPIO G9E°0F PTI OL E21 0 CET OF oR0°0| Teo:0| 让 有 有 


EE 


9009"0) 一 cr 要 


Fe 0) 一 《证 


Ee 


= 了 7 了 了。 


及 一- 【2 一 
x 严 1 ) 一 {x, ~ Xs Kes Xs Xo}, 


x 一 x = {x x RX XA 
2 逐个 修改 法 
按 批 修 改 汪 是 将 全 部 样品 答 和 人 后 形 焉 各 个 类 才 政 灾 察 点， 机 
逐个 修改 法 是 每 输 人 一 个 样品 河 时 就 改变 该 样 


点 ,这 种 方法 最 早 是 MacQueen 在 1967 年 提出 的 ,有 
KK- 均值 法 。 后 来 有 人 将 它 作 了 改进 ， 盟 1 


如 下 : 


i 定 出 分 业 数 目 玉 , 按 样品 编号 取 前 


时 的 


对 应 图 3.1 的 第 一 站 


EE 格 : 选择 网点 小 


玉 个 样品 作为 聚 点 ( 相 


tL 
上 | 


所 进入 的 类 的 紊 


0H 


些 书 称 它 为 
逐个 修改 话 其 步骤 


i》 将 余下 的 # 一 天 个 点 逐个 输入 ,每 输 人 一 个 点 将 它 轨 入 到 


谎 靠 证 的 聚 点 的 那 
聚 点 ( 相 
iii) 将 壮 个 社 


卜 习 


村 应 于 图 3.1 的 第 一 其 
逐个 输入 ， 每 输入 一 个 将 它 归 到 最 近 育 
一 类 ， 立 刻 重 新 计算 该 类 重心 以 代 巷 原 聚 点。 如 果 #* 个 点 输 


一 类 ,立刻 重新 计算 六 类 的 


个, 并 将 它 代 上 蔡 师 


E 格 : 初始 分 类 ) 


器 二 
GE 


完 后 所 得 的 分 类 与 原来 分 类 入网 则 过 程 停止 ， 否 旭 再 重复 输 人 天 


个 上 


交点 ( 扯 


过 程 中 可 根 提 
可 分 离 产 乍 新 类 ， 


对 应 于 


图 3.1 的 外 
了 的 逐个 修改 法 是 对 十 


| rs 
Cig 


i)》 定 出 三 个 数 K,C 和 RC(R 之 C0 > 0) 


ii》 娶 交 天 个 样品 作为 紊 点 , 计算 民 个 豪 沾 轧 


如 染 最 小 的 距离 小 


为 新 的 聚 点 ,再 重复 这 个 步骤 ,直到 所 有 的 率 点 两 
FC 为 正 . “注意 此 时 褒 点 数 且 可 能 比 下 小 ) 

iii》 将 余下 的 # 一 下 个 样品 点 未 个 输入 ,每 输入 一 个 
轧 点 的 晤 小 阶 离 大 于 RR 网 该 点 作为 一 个 新 的 聚 
EE 网 小 于 及 如 将 该 点 归 到 捞 它 最 近 的 聚 点 的 异 一 类 ， 


大 


如果 该 点 到 所 厂 
点 ;如 果 最 小 


三 酉 格 : 修改 分 类 )。 


的 KK 在 修改 分 类 的 


8 实际 情况 有 所 变化 , 太 近 的 类 可 以 合并 , 太 远 的 类 则 
只 休 步 又 是 ; 


两 之 间 的 距离 ， 


于 5 , 则 将 这 两 个 育 点 侣 并， 


这 两 点 的 重心 作 


之 间 的 距离 都 


i 
人 HI 


hi, 


并 立刻 让 算 这 一 类 的 重心 以 代替 原 法 点， 然后 又 重新 验证 聚 点 之 . 


。37 季 。 


间 的 距离 是 否 大 于 CGC， 如 果 小 于 C 则 用 ii 的 办 法 将 其 合并 , 亡 
济 所 有 党 点 之 疗 的 距离 都 大 于 £，。 

iv) 将 ”个 样 晶 以 状 至 尾 逐 个 办 人 和信， 用 步 马 让 ) 的 兴 法 归 
类 ,但 稍 有 不 同 ， 茶 个 样 喇 点 输入 所 如 时 分 类 与 原 六 一 样 则 重心 
不 必 计 算 , 如 潜 分 类 与 诛 洒 不 池 , 该 样 肯 新 涉及 的 两 类 的 重心 部 得 
重新 计算 。 

Y) 按照 1 的 方法 进行 修改 ， 如 业 相 邻 两 次 的 修改 分 类 完全 
相 重 合 则 过 程 售 止 , 否 刚 继续 修改 ， 

例 3.2 用 逐个 修改 法 对 例 3.1 中 12 个 样品 点 进行 妇 业 ， 取 
Kk, C= 020, R= 0.30. 

i 眼前 两 个 样 晤 x 一 C0.707,0.3857Y, Xi 一 (0.600, 0.433Y 
作 缘 点， 计算 x 与 x; 的 距离 dx,x2) 一 0.117 之 CC 因此 合 
并 xis x，， 且 计算 其 重心 为 


Ji 一 了 xi Xe) = (C0.654,0.409), 


相对 应 的 类 记 为 x1， 此 时 的 x | 一 {x1,xi}。 

ii) 逐个 输入 余下 的 样 上 第 x ~ xwz， 倪 如 输入 x;， 即 计 息 x， 
与 育 点 其 ”的 距离 d(xs，8.9) 一 0.104 必 民 ， 因 此 将 xx， 只 和 
wy 此 让 有 XX 三 个 样品 ,立刻 计算 其 恒心 


yi 一 到 《十 和 十 了》 一 【0.662， 04 和 41。 


接着 输入 x， 即 计算 x 到 ”的 距离 式 x， 7 了) 一 0.110 一 
民 ,将 x 归 和 人 ri， 再 计算 xi， 的 重心 作为 新 的 聚 点 ， 继 续 输 人 
样品 点 ,直到 输入 六 时, 它 与 率 点 的 距离 汐 0.349 汪 RRR， 因此 加 
作为 一 聚 把 ， 另 立 一 类 ， 记 为 = 此 时 x， 只 有 x;。 继续 输 人 
Xs， 妈 计算 x 与 两 个 误 点 的 耻 离 ， 按 最 近 蝗 名 归 奖 的 原 网 ，2zn 
应 亲人 Fi， 此 时 = 有 zx 一 xyxa 十 个 样品 ,计算 它们 的 童心 
代 普 原 聚 点 ,这 样 一 直 做 下 去 直至 12 个 样品 点 全 部 输 完 得 到 初 始 


了 了 75 。 


天 各 一 [和 Xe Ks Ni} xr {Xi ,Xa Xn X12}e 
iii> 进行 傍 改 分 英 。 计 算 初 始 分 燃 的 重心 ; 
zt9 一 二 Y， Xi C0636,0.434Y 


和 


ztn 一 2 x; — {0.803,0.673Y 
FE, 


此 dzf ,zx 名) 一 0.292 > CC。 按照 逐个 修改 法 iv) 的 原则 将 x 
一 XL 从 头 至 尾 逐 个 输 和 得 到 第 一 次 修改 后 的 分 类 结果 : 
x = {x ~ E 一 Xi Xi Ky KX 
计算 zi 与 x 的 重心 
zi 了 xi (0.628,0.409Y 


Tesi 了 


zz 一 Tx 0.779,0.6597 

ier;! 
且 下 zz 人 0) 一 0.292 0 按照 逐个 修改 法 iv) 的 原则 进行 第 
二 次 修改 , 即 了 以 当 ” 2 为 良 点 ,将 x ~ x 从 闫 至 尾 再 输 人 ,得 
到 第 二 次 修改 后 的 分 类 结果 与 第 一 次 修改 的 分 类 结果 完全 一 致 ， 
从 而 停止 。 即 第 一 次 由 改 的 结果 便 是 我 们 按 逐 个 修 政 车 得 到 最 斤 
上 面 介 绍 的 按 批 修改 荡 和 逐个 修改 法 类 似 于 计算 方 落 的 登 
代 法 ,它们 是 否 收 化 呢 ? 在 理论 上 着 一 个 很 重要 的 问题 ,对 于 Mac- 
Queen 的 下 -均值 法 , 1967 年 Mac Queen 本 人 人 给 出 了 一 个 证 组 ， 
而 按 批 修改 法 的 收 久 性 ，Diday 在 1974 年 也 给 出 了 一 个 证 明 , 有 
兴趣 的 读者 可 参看 [9]、522]。 


48.4 降 维 法 及 图 法 


在 二 维 平 面 上 点 央 是 人 们 所 熟悉 的 一 种 方法 ， 便 如 在 回归 分 
析 中 如 代 只 有 岗 个 变 计 (一 个 因 变 量 , 一 个 自 诺 董 ), 那 么 我 们 可 以 
» 76 * 
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各 据 # 对 观测 数据 在 直角 坐标 系 上 点 图 ， 由 散 点 图 大致 便 可 于 出 
它们 是 否 存 在 线性 相关 ,因此 ,在 聚 类 分 析 中 寻找 将 多 变量 的 样品 
点 在 平面 上 进行 点 图 的 方法 长 期 以 来 为 人 们 所 关注 的 一 个 课题 。 
在 本 亨 中 我 们 将 介绍 一 种 非 线性 的 喘 象 降 维 法 以 及 一 种 比较 实 胃 
的 星 序 图 法 。 

《一 ) 非 线性 映 锡 法 

设 zi 一 [zizaiy 1,2,.…*,n) 是 了 维 空间 中 的 
# 个 样 酝 点 ,我 们 希望 将 它 瞎 射 到 二 维 空 间 、 设 在 二 维 空间 的 映射 
点 是 

PW yi] Ci 12) 

并 县 要 求 这 种 映射 尽 可 能 保持 距离 不 变 的 原则 。 这 样 就 可 根据 映 
射 点 y(t 一 1,2,*:--，#)》 在 平面 上 点 图 进行 聚 类 ， 没 5 为 原 
? 维 空间 中 虚 zx 与 x; 的 欧 氏 距离 ，ds， 为 二 维 空间 中 对 应 于 
xi， Xi 的 点 与 3 的 欧 氏 了 距离。 非 钱 性 上 映 策 的 降 弘 原则 基 尽 
可 能 地 使 必 与 经 一 样 长 .为 此 , 引 人 非 线性 换算 洁 据 或 着 说 
目标 苞 数 : 


4 一 SE 二 一 2 we 一 i 


[| 


C4.ty 
其 中 NF 一 也 49 称 为 标准 化 因子 ,ws 一 并 称 为 权重 系 


数 。 显 然 《 是 和 1 一 1 一 12， vs) 的 函数 ,。 它 的 合 义 是 
使 原 空 间 点 之 向 的 更 离 与 对 应 的 新 空间 点 之 间距 离 之 差 的 平方 达 
到 极 小 来 求 得 新 空间 点 之 间 的 几何 构 形 , 求 {3;i} 常常 采用 Ne- 
wton-Raphson 的 选 代 靶 。 具 体 计算 步骤 如 下 : 

1” 根据 = 个 样品 点 Xi 玫 Cryxys X12， 
#4) 计算 两 两 之 同 的 欧 氏 距离 性 )， 得 距离 盾 阵 ; 


§ PF 


* 
计 停 之 dy 得: 


2° 在 二 维 空间 中 取 5 个 初始 点 : 
yo— Cy PY jo 1 2, 
一 般 初始 点 可 采用 样品 在 前 两 个 主 成 分 二 的 信 ( 参 看 第 九 章 )， 册 
初始 点 yp 一 1,2,"…,#》 可 算出 两 两 之 间 的 曰 离 并 代 人 (4.1) 
得 到 | A 
39 由 yi 一 1,2,-…,#) 及 如 下 的 选 代 公式 ; 
yA (4.2) 
(i ,2 1 
甘 中 江 汐 迄 代 次 数 , 和 为 控制 参数 ,可 经 验 邮 取 为 03 或 0.4, 而 
a4d™ /| ed | 


(mm) > 
A Oy By 
这 里 
94™ 2 dD yi 
-TY , 人 Yi ys 全 3》 
全 7 各 NF dsr; * de 1% 
ur 
OA'™ 一 2 | * 《om 
一 5 一 
By 2 za 
a 
mY) i A 
sr Cy yi) 和 实 > “(i+ 十 一 上 一 daj — de | 
a a 


fm ,2 
可 算出 y 一 Cy) 5G 一 1.2, 夫 ， 并 把 它 代 人 (4.1) 计 
算得 442。 再 由 yj 及 迭代 公式 (4.2) 可 算出 yy， (if 一 1,2， 
里 7 


人 5 ha 90F'0 dar*0— 区 人 人 人 "人 eet*0 é 
po | 和 tIo'0 De OD se£0— Too0*1 99*0 8 
Fey FE— 2¢6"°0 616°0 ep 之 0 全 工 一 T1655"1 67" 1 . 
TO0'1— dho"0 3TT 和 一 Tro*T—™ 下 一 T02T 9fe*1 9 
Rts' 0 258°0— Og0°0 £800 | zy0— See" 一 TIR° I YE 5 
S60°0— 和 一 Dry 68¥"1— 8T*D 一 9g7*1— 近代 | 60T 1 + 
jy S050— 092'0 1 E66 0 一 FT 站 一 也 全 一 og92"T | [和 : 灿 | 下 
| 
966°0 £290°0— OrT 0 i 96F "OC— 190°0— Bz 0 Dy"0 Ot" Y 
5 T Li 00°v | 90°0 000 0 | 009 0 人 0 人 站 T 
b I 9 中 了 2 L 、 多 
时 事前 寓 曲 二 吻 需 遇 划 于 闪 湖 政 


省 丑 钟 了 时 水 姓 调 江 并 福 嵌 三 工 贸 加 过 医学 


T? 于 


"379， 


… ,ny， 并 代 人 (4.1) 计 算得 《3 …， 一 直选 代 到 第 3 次 ,使 得 
对 于 事先 给 定 的 85>0 有 4 ?一 4 二 5 就 停止 、 最 后 以 
3， 和 一 12 0) 作为 所 全 一 12 3) 在 二 维 平 面 上 
的 映 象 。 . 

例 4.1 有 六 维 空间 上 的 九 个 点 ， 它 们 过 勾 地 分 布 在 三 条 边 
上 ，, 现 要 将 这 九 个 点 映 到 二 维 平面 上 , 其 数据 烈 在 表 4.1 

取 二 维 平 面 上 的 正方 形 为 初始 构 形 ， 平 面 上 的 八 个 初始 点 均 
勾 分 布 在 四 条 边 上 ，, 另 一 个 点 在 中 心 * 进 行 迁 代 ， 当 选 代 到 4 一 
10* 时 ，yj(i 玫 1,2,……，9) 的 坐标 列 在 表 4.1 的 最 后 两 列 中 ， 
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图 4.1 二 维 平 面 上 的 蕊 个 映 象 点 


读者 自己 可 去 验算 六 维 点 之 间 的 距离 与 对 度 的 二 维 点 之 闻 的 距离 
很 接近 的 。 将 映射 后 的 九 个 二 维 点 画 在 平面 举 标 上 刚好 也 是 均匀 
分 布 在 正三 角形 上 的 九 个 点 (网 图 4.1)。 

降 维 的 方法 目前 已 提出 了 许多 方法 ， 如 主 成 分 靶 ( 见 第 九 章 ) 
以 及 各 各 排序 法 ( 凤 [171)。 

(二 》 县 窗 国 

星座 图 是 将 # 个 了 维 点 画 在 一 个 上 半 贺 内 ， 一 个 样品 点 对 应 
一 颗 青 ,同类 梓 品 组 成 一 个 星 府 ， 不 同类 的 样品 有 不 同 的 星座 , 故 
称 为 星座 图 。 

设 Xi xpisrais yoi 了 到 1 2 为 7 个 了 P 维 样 包 
点 。 


30 


先 把 数据 {zx} 作 一 个 变换 ,使 其 小 在 [0,x] 之 内 ,这 只 须 


省 min ws 
Ej y 
fn - 4.3 
PT max Xi nln wi ( 


| 1 所 1 于 不 


相应 于 每 一 个 谈 量 xi 取 一 个 权 wi 关 0Gi 一 1,2,……*, 了 ,是 满 


足 分 wi 一 1。 然后 就 可 开始 页 星座 图 ; 


i=t 


在 直角 众 标 系 中 以 原点 0 为 圆心 以 单位 长 为 半径 作 一 个 上 半 
圆 ,所 有 的 样品 点 按照 革 一 规则 都 画 在 这 个 半圆 内 ,每 个 料 品 按照 
这 种 规则 都 能 找到 它 在 半圆 内 相应 的 位 置 。 如 要 找 样品 xi 的 位 
置 , 先 以 0O 为 贺 心 wi 为 半径 作 一 个 上 半 阅 ,在 该 圆周 上 对 应 于 绝 
度 为 9 的 点 记 为 O,， 再 以 O41 为 圆心 ww， 为 灶 径 作 一 个 上 半 
圆 ， 在 该 车 周 上 对 应 弧度 为 和 的 点 记 为 0;， 再 以 DO， 为 贺 心 
ws 为 半径 作 上 尘 贺 ， 在 该 圆周 上 对 应 于 张 度 yj 的 点 记 为 上 0,， 
"……， 如 法 炮制 ， 最 后 在 以 wv。 为 半径 所 作 的 上 半 贺 上 对 应 着 弧 
度 yn 的 点 记 为 O,。 该 点 便 是 样品 xj 的 星座 位 置 ， 记 为 五， 
虫 上 述 的 作法 可 看 出 ， 样 品 x 的 位 置 必 在 以 单位 长 为 半径 的 上 


半 贺 内。 如 了 一 3 时 , 取 ww 一 wz 一 ws 一 二， 样品 点 xj 的 位 置 


1 . 
图 4.2 p= 3 ww; -3 一 13293 时 ;样品 x 的 位 置 = 


* 381*» 


的 而 法 如 网 4.2 所 示 。 

出 0 点 出 发 接 照 上 述 的 作 图 方法 ，x; 达到 星座 位 置 的 路 线 
称 为 xi 的 路 径 ,路 径 基 本 上 刻 划 了 该 样品 的 特征 ,在 实际 中 我 们 
并 不 是 按 上 述 的 作 图 方法 一 个 样 显 一 个 冬 品 的 去 找 它们 的 位 置 ， 
而 是 直接 计算 它们 的 星座 位 置 五 的 坐标 ， 便 可 立刻 点 图 了 . 设 
xi(i 一 1,2,"…,#) 的 星座 位 置 沟 zi(j 一 1, '…*，#)》 在 直角 坐 
标 系 中 容易 证 明 zi 的 两 个 坐标 为 


(j= 1,2,..*,n) C4.4) 


因此 我 们 只 须 概 据 每 个 变 景 的 权 wi 及 样品 的 ?个 变量 的 换算 
值 , 便 可 计算 得 *; 所 对 应 于 平面 上 的 点 z; 的 坐标 ， 

例 4.2 从 藉 地 了 眉 采 代 了 二 个 土壤 样品 分 析 了 五 个 指标 ; 鸭 
一 燃烧 损 兴 ，x 一 可 交换 磷 ，x 一 可 提取 铁 ，* 一 总 磷 ,*; 一 
总 氮 。 通 过 (4.3) 式 将 原始 数据 变换 为 [0,71] 中 的 数据 yo 一 
12500 0 并 刘 于 天 4.2， 取 


wi i 112,."*,5), 


利用 《4.4) 式 可 算出 10 个 土壤 样品 在 星座 图 中 相应 的 两 个 坐 标 ， 
并 画 出 它们 相应 的 位 置 ,如 图 4.3. 所 示 ,由 图 中 可 看 出 十 个 土壤 样 
晤 可 分 为 两 类 ; | 
{Ty ~ XIX es Ky sio} , {Xi Xs}, 
关于 图 亲本 志 纪 七 十 年 代 以 来 已 产生 了 许多 多 变量 的 图 表示 
法 ， 如 雷达 图 ， 术 图， 三 角 多 项 式 图 及 连结 向 量 图 等 等 ， 由 于 篇 
晨 有 限 我 们 不 能 一 一 介绍 了 、 有 兴趣 的 读者 可 参看 [241、!25]、 
[z9] 。 本 
了 8 


家 4.2 十 个 土壤 样品 的 > (弧度 数据 


NA 和 号 : | | 


图 4.3 十 个 土 十 样品 的 星座 图 


$ 8.5 有 序 样品 的 聚 类 


前 面 介 绍 的 聚 类 方法 与 样品 的 顺序 无 关 ， 租 在 有 些 实际 问题 
中 样品 是 有 顺序 的 ， 分 类 不 能 打 乱 顺序。 例如 在 地 质 勤 探 中 通过 
氏 并 的 关心 样品 欲 将 地 层 分 类 ， 此 时 洗 心 样 尽 是 由 浅 判 深 的 顺序 
取 的 。 又 如 气象 资料 它 是 按时 间 排 询 的 ,其 样品 也 是 有 序 的 。 
设 xx 是 顺序 取出 的 样品 ， 和 欲 将 它们 分 成 若干 展 
《 即 若 干 类 ) 每 层 的 样品 必须 是 相仿 接 的 , 即 每 层 必 须 是 星 砚 {xi: 
* 8 。 


有 319 本 Ci 闵 1 7 溢 站 这 种 形式 ,我 们 称 它 为 样 师 自 。 

按 顺 序 的 # 个 样品 ,它们 之 闻 有 # 一 1 个 空 隐 , 若 在 基 空 隙 志 
一 刀 , 则 分 官 为 二 了 段 ; 若 在 茶 两 个 空隙 各 切 一 妃 ， 则 分 荐 为 三 段 ， 
…, 攻 每 个 空隙 都 分 别 切 一 刀 , 则 每 一 个 样品 各 成 一 段 ， 

现在 对 于 茶 个 天 (1 过 下 < 之 ww)， 要 将 # 个 样品 分 成 人 眉 ， 显 
然 所 有 可 能 的 分 割 有 Cc*-1 种 ， 我 们 要 寻找 出 一 种 分 割 使 得 六 个 
航 的 段 内 差异 尽 可 能 的 小 ,各 假 之 部 的 差异 尽 可 能 的 大 , 称 这 种 分 
割 为 相应 于 天 个 样品 段 的 最 优 分 赫 。 自 内 的 差 寞 如 何 度量 昵 ? 按 
”多 元 方差 分 析 的 思想 ,样品 段 {xipwit zi C 守 1,1 之 门 的 
息 内 差异 可 用 广 尽 方差 来 度量 . 


i 
di 一 ba (xs — EC CK 一 EO) | (5.1) 
B= 


其 中 2 = TT i) ,i 


让》 世 可 以 用 2 《xs 一 地 05 门 xs 一 谋 (i, 站 》 的 迹 来 度量 , 即 


于 


研 守 一 tr 阳 《xz — EC Xa 一 zpy | 
B= 


一 之 DD) xo — Foti, (5.2) 

其 中 Gi, 让 为 24(i,j) 的 第 z 个 分 量 。Fisher 采用 了 (C5.2), 因 
此 硼 应 的 最 优 分 割 也 称 为 Fisher 分 割 。 通常 我 们 把 ad;; 称 为 冬 
品 眉 {x;，*- xi 的 直径 ， 

为 了 方便 ， 第 i 号 样品 x; 简 记 为 i, 把 二 个 梯 品 分 割 为 及 
女 , 设 某 一 种 分 割 法 是 : 

Sns Ki = it ys Oo i tt 1 1} 

"tigix 1 -2} 
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其 中 让 一 1 < 和 3 定义 这 种 分 衣 的 误差 菌 数 为 


(SC2 下 )7 一 BD diwn—! (5.3) 


邯 某 种 分 割 法 的 误差 函数 为 该 种 分 割 的 入 个 段 的 直径 之 和 。， 当 ” 
和 外国 定时，ECSCn, 天 )) 越 小 表明 在 45.2) 的 音义 下 各 眉 内 的 差 
异 越 小 ， 分 类 越 台 理 ， 因 此 要 寻找 一 种 分 靶 使 得 65.3) 达到 最 小 . 
设 使 误 壮 函数 达到 最 小 的 分 法 是 5 Ca， 天 )， 相 应 误差 函数 值 为 
ECS(n,K)). 

1? 最 优 二 分 割 

二 分 割 是 将 # 个 样 瑟 分 割 为 两 段 , 一 若 的 分 法 有 Ci_t 一 
一 1 种 : {1}{2,-…,n},{1,2}{35 mn} {1,2 nO 1} 
{zn}。 习 然 ， 每 种 分 割 的 误差 函数 为 ECSC5,， 2) 一 ii 十 d,s 
CG 一 2 1， 找 出 一 种 分 割 5,C(#,2) 使 得 

E(tSotn,2)) min, Cd + dia) (C5.4) 


则 Se 2)》 就 是 最 优 二 分 遍 。 

2 最 优 三 分 割 

三 分 市 是 将 * 个 样品 分 割 为 三 妇 ， 所 有 的 分 割 法 有 C= 
(az 一 1 一 2)72 种 ,每 一 种 分 宴 的 误差 荡 数 为 EC5SC#,3)) 一 
中 一 1), 轴 然 ， 它 是 等 价 于 先 将 
个 料 吕 分 灾 为 丽人 和 一 1 十 1 一 1 7 一 1} 
住 ，,*"*;w}， 然 后 再 将 前 一 段 分 割 为 两 眉 ， 因 此 有 

ECStn,3)) = ECSCis — 1,2)) + di 
若 Stn,3》 是 最 优 三 分 割 ,那么 应 有 
E(So(n,3)) 一 min [ECS — 1,2)) tad] (C5.5) 

其 中 SG 一 1,2) 为 前 i 1 个 样品 的 最 优 二 分 割 。 轩 此 寻找 
最 优 三 分 割 必须 对 前 一 1 (3 志和 所 个 样品 进行 最 优 一 分 
割 ,然后 根据 (5.5? 就 可 找到 最 优 三 分 割 。 

3” 最 优 K 分 割 


395. 


寺 对 # 个 样品 进行 最 优 天 (4 声 太 过 # 一 1) 分 户 ， 与 2 中 
所 述 的 最 仿 三 分 着 同 理 等 价 于 先 将 # 个 样品 分 制 成 两 良 : {i 二 1， 
i 一 1}{ix;……，*}， 然 后 将 前 一 让 再 进行 KK 一 1 分割 ， 若 
Sm:K) 是 最 们 天 分割, 则 有 

ECSoCn, KY) Tin LECS(ix 1K— Dt dl (3.6) 


其 中 Seix 一 1， 开 一 1) 为 前 ix 一 1 个 样品 的 最 优 K 一 1 分 
割 。 因 此 要 寻找 最 忧 天 分割 必 须 对 前 ix 一 CK 志气) 个 样 
品 先进 行 最 优 K 一 1 分割 ， 然 后 根据 (5.6) 式 就 可 找到 最 忙 天 分 
割 ， 

由 上 面 的 讨论 可 知 , 要 进行 最 优 天 分 割 主要 是 计算 两 个 表 , 第 
一 个 是 计算 # 个 样品 一 - 切 可 能 的 样品 段 {x;，-…*， Xxi}(l < 一 
i 长 #) 的 直径 {dj}。 第 二 个 是 最 小 误差 函数 表 {EC5,Cm, 由); 
f 和 一 1}、 第 一 个 表 的 计算 直接 按 公 式 (5.2)， 
第 二 个 表 的 计算 是 根据 第 一 个 天 即 直径 一 览 囊 及 公式 (5.4) 计算 
ECSAm2)0),m 一 23， 站 然后 按 公 式 (5.57 计 算 已 CS 
3 )) ,着 一 34 .sz。 以 此 类 推 一 直 计 算 到 E 《Smm，K 一 1))， 
二 一 天 一 1; 氏 ，.…，#。 最 后 根据 (5.6) 便 可 得 最 优 KK 分 割 。 注 
意 , 在 具体 找 分 割 点 时 应 该 是 这 样 : 首先 找 由 了 《最 后 一 段 的 第 
一 个 料 品 号 ) ,使 得 

五 Ke 一 1; 民 一 工 ) 访 十 如 
达到 最 小 , 即 i 是 满足 (5.6) 式 : 
EC(Sljr — Kl)D+ do — min [BLS(ir 
Ki 
— 1,K— 1)) + ds) | (5.7) 


然后 再 找 jx _1， 使 它 满足 关系 式 
ESCik- 一 1,K— 2)) 十 二 


jE: 二 


min 
Ki IK 


” [ECS(ix. 一 1,K 一 2)) 十 | 5.8) 
以 后 依次 类 推 , 找 出 7 jE-33 wi jsf1( 一 1); 于 是 得 到 景 优 
下 分割 为 


* FH # 


igriyg 


和 一 1 一 

分 割 数 K 如 何 确定 呢 ? 一 般 情 况 下 有 两 个 办 法 : 《i) 可 经 验 
好 取 一 个 玉 值 ， 或 者 按 最 忧 二 分 割 ， 三 分 宏一 直 作 下 去 下 到 能 说 
明 你 的 实际 问题 为 止 。 (ii) 给 定 一 个 小 正 数 85 之 0, 使 得 妆 
1BKSCz: 天 一 1)) 一 ECSoCn, 玉 ))] < 8, 就 停止 ,满足 此 不 等 式 的 
天 。 即 为 分 割 数 日 。 

我 们 通过 一 个 例子 来 说 明 上 述 的 计算 步骤 ， 

例 5.1 和 根据 某 地 云 杉 生长 过 程 表 算 出 140 年 之 内 每 10 年 直 


径 生 长 最 (x1) 和 每 10 年 树 高 生长 车 (x;), 其 数据 列 于 表 51。 根 
据 此 表 杰 对 云 衫 的 生长 过 程 进行 分 类 , 呈 分 成 三 类 或 者 四 类 ， 
表 5.1 云 杉 的 直径 和 树 高 每 10 年 的 平均 生长 量 


?0 | B80 | 20 | 10D | i10 


120G1130|140 


2 | 114 | 2.8 | 3.0 | 2.8 | 2.6 12.7|1.502.4|1-4| 1.8 | 1.11.711.0 


为 了 方便 用 树龄 除 以 10 后 作为 该 年 龄 段 样品 的 编 配 ， 如 如 
年 其 编号 为 8 号 样品 。 
i》 按 (5.2) 计 算 14 个 样品 一 切 可 能 的 样品 段 的 直径 diw, 并 列 
在 表 5.3。 例 如 
da — > Crp E36 


Bmi oar- 


一 >) [me — F360 + Cx — Hl3,6)7] 
B=3 


-= ,288 
ii) 根据 表 5.2 计算 最 小 误差 函数 表 5.3， 
首先 计算 分 湖 数 一 2 这 一 行 , 当 sm 一 2,t 一 2， 即 只 有 前 
两 个 样品 ,分 成 二 毁 ， 每 段 只 能 是 一 个 样品 ,误差 郴 数 为 0。 当 二 
一 3 一 2 时 , 即 前 三 个 样品 分 成 二 段 , 有 两 种 分 法 : {1} {2,3} 


a 337 。 
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及 {1,2}{3}, 由 (5.4) 有 
E(S(3,2)) ™ mia, (di 十 di,s) 一 min[ (dt d,s) Cds 
二 da)] = min[ (0 + 1.00),00.965 + 0)] 
一 0.965 
因此 对 于 mw 一 3,: 一 2 时 ， 最 优 二 分 割 点 在 第 二 个 荐 品 之 后 ,并 
用 小 括号 列 在 表 5.3 相应 的 位 置 上 、 当 坟 一 4,+ 一 2 时 ,， 即 前 
码 个 梯 品 分 成 二 让， 有 三 种 分 法 : {1}{2,3,4}, {1,2}{3,4}, {1， 
2,3i4+， 辐 样 由 (5.42 有 
ECSo4,2)) 一 ,Tin 人 4， jt di = min[ (Od 
+ .780),00.965 十 0.145),C3.833 十 0] = 1.110 
分 割 点 定 第 二 个 样品 之 后 ,并 填 在 表 5.3 相应 的 位 置 上 。 类 似 地 
可 计算 mw 一 $5,6,-……,14 的 最 优 二 分 割 的 C5,Cm，2)) 并 填 在 
表 中 相应 的 位 置 上 。 | 
接着 再 计算 表 5.3 的 第 二 行 , 即 分 割 数 1 一 3.. 当 严 一 3， 
1 呈 3 时 ,显然 只 有 一 种 情况 ,此 时 E(580(3,3)) 一 0. 当 m 一 4， 
1 一 3 时 ,由 (C5.5) 有 
BCS 4,3)) 一 min{[ ECSK2,2)) + dl] ECSC3,2)) + dr]} 
= minfC0 + 0.145), {0.965 十 0)} — 0.145 | 
由 此 可 看 出 前 4 个 祥 品 的 最 优 三 分 割 应 该 是 {1}{2}43,4}， 第 二 
个 分 割 点 在 第 二 个 样品 之 后 . 并 将 0.145 及 第 二 分 割 点 填 在 表 5.3 
的 相应 位 置 上 .如 此 继续 下 去 便 可 把 表 5.3 ee 
利用 公式 《5.6) 可 算出 表 5.3 的 第 三 行 ， 即 法 分 割 数 :一 4 
时 ，m 一 4,-…,14 的 各 种 最 优 匹 分 割 ， 
ii) 分 眉 . 先 扫 14 样品 分 三 段 的 最 忧 分 割 点 . 即 找 六 使 得 
ECS(14,3)) 一 ECStjs 一 1 227 十 dj 
| 一 Bi ES 一 1,2)) 十 dis,n] 
以 表 中 可 计算 出 当 六 一 1 一 7 了 时 ，ECS0C7， 27) 十 de 一 1.345 
十 2.397 一 3.742 一 EC5C14,3))， 因 此 广 一 1 一 7 符合 要 求 ， 
这 表明 了 最 优 三 分 割 的 第 三 眉 为 {8,…,14}， 而 头 两 段 必然 是 {1， 
» 390 * 


2，…7} 的 最 优 二 分 割 , 由 表 可 查 出 广 一 上 一 2 为 {1,2,…,7} 的 最 
优 二 分 割 的 分 割 点 《 即 在 第 二 号 样品 之 后 )、 这 样 便 得 到 14 个 样 
上 蝇 点 的 最 忧 三 分 割 为 : 
{1,2}, {3~7}, {8~14}, 

用 同样 的 手续 可 将 14 个 样品 点 进行 最 优 4 分割， 这 时 :一 
4， 由 这 5.3 计算 出 

五 (3514 4) 一 2.586 《1 一 上 一 12) 

ECSA12,3)) 2161 人 一 1 一 7) 

ECSC7, 2)) 一 1.345 (六 一 1 一 2) 


故 最 优 王 分 割 为 
{152},43~7},{8~12},{13,14}, 


习 题 八 


8.1 下 面 始 出 七 个 样 帅 本 丙 之 间 的 距离 ( 欧 氏 )? 征 阵 ; 
1 2 3 #4 5 5 7 


1 0 
2 4 0 
3 7 3 2 
D= 4 1l2 & 5 0 
5 18 14 11 看 0 
站 19 15 12 7 1. 0 
7 21 17 14 9 3 2 0 
试 分 别 用 Co) 最 小 距离 法 ，(5) 最 大 耻 离 法 ，(r》 类 平均 距离 法,C4) 
重心 距离 法 进行 聚 类 ,并 面 出 谱系 图 ， 
3.2 证明 二 态 变 辐 的 相关 系数 为 (1.9) 式 。 


8.3 下 面 给 出 了 八 个 样品 的 黄 个 指标 数据 


试用 一 分 为 二 的 分 解法 进行 聚 闫 ,并 画 出 谱系 图 。 

3.4 对 8#.3 中 的 八 个 样品 ， 利 用 按 执 修 改 法 进行 聚 类 , 采用 欧 攻 区 离 
(了 权 1 号 、3 号 和 ? 号 样品 作 生 点 }。 

8.5 证明 最 大 距离 尘 、 高 著 平 方 和 法 以 及 类 平均 法 都 具有 单调 性 、 

8.6 设 4,8,C 为 平面 上 三 个 点 ;它们 之 阅 的 距离 为 上 一 4,c 一 
1.1sd3c 一 1、 将 4.8. 看 成 三 个 样品 * 试用 这 全 数据 说 明 重 心目 离 法 不 
具有 单调 性 ， 

8.7 对 某 地 区 十 个 其 ,调查 了 五 个 指标 : z = 土 好 生产 率 *x: = 劳动 
生产 率 ，#9 一 人 均 收 和 入， 一 费 果 水 衬 。z 一 农村 工业 比重 ， 五 个 指标 
的 权 数 分 别 为 oi 一 0.23m: 一 0.23ym 二 0.3 一 0.13o 一 0.2。 其 调查 
数据 如 下 表 , 试 用 基 座 图 涌 类 . 


~ | 
县 号 一 
T 直人 
和 村 人 
者 1 132 
地 379 | 255 302 
x 202 | 306 | 1 | 36y 98 
可 0.87|0.93 0.97 
0.45|0.20 


8.8 ” 设 有 六 个 有 序 样品 ;一切 样 醒 眉 的 直径 di; 如下: 


i | 1 | 


试 求 这 六 个 有 序 标 吕 的 最 忧 三 分 勒 ， 
+ 392 ， 
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第 九 章 主 成 分 分 析 
39.1 概 述 


主 成 分 分 析 是 将 研究 对 象 的 多 个 相关 变量 (指标 ) 化 为 少数 几 
-个 不 相关 的 变量 的 一 种 多 元 统计 方法 。 在 多 变量 的 分 析 中 ， 为 了 
尽 可 能 完整 地 搜集 知 息 ,对 每 个 样品 往往 要 测量 许多 项 指标 ,当然 
这 可 以 避免 重要 信息 的 遗漏, 然而 从 统计 的 角度 来 看 ,这 些 痰 量 可 
能 存在 着 很 强 的 相关 性 , 便 得 分 析 问 题 增 加 了 复杂 性 。 因 此 , 息 然 
想到 用 少数 几 个 不 相关 的 综合 变量 来 代替 原来 较 多 的 相关 变量 的 
证 究 。 而 且 要 求 这 些 不 相关 的 综合 变量 能 够 反映 愿 变量 扣 供 的 大 
部 分 信息 ,从 数学 的 角度 来 看 ,这 就 是 降 维 的 思想 .我 们 以 二 维 的 
情况 来 直观 地 说 明 ， 设 每 个 样品 测定 了 两 个 变量 x 种 x， 料 样 品 
根据 两 个 变量 的 数据 点 在 平 而 上 , 如 图 1.1 所 示 。 样品 点 之 间 的 
差异 ,显然 是 由 于 * 和 * 的 变化 
引起 的 ;从 图 上 看 x 与 到 的 变化 
范围 都 相差 不 大 ， 如 时 我 们 将 举 
标 轴 进行 一 个 旋转 ， 不 难看 出 样 
节点 的 差异 主要 体现 在 六 轴 上 ， 
若 六 所 体现 的 差异 占 了 大 部 分 ， 
医 如 85 入 以 上 ,那么 我 们 可 将 罗 
忽略 , 只 考虑 六， 这样 两 个 变 重 
就 缩 碱 了 一 个 ， 问 题 也 就 相对 地 
简化 了 。 显然 与 为 都 是 
和 %% 的 线 往 组 合 , 称 7 和 y, 分 
别 为 变量 (%,*a》 的 第 一 主 成 分 和 第 二 主 成 分 (严格 的 定义 后 面 
再 给 出 )。 
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一 般 情 况 , 设 毕 品 有 靖 个 变 昨 , 若 拌 昌之 间 的 次 异 能 由 彦 个 变 
重 的 乓 (下 < p) 个 主 成 分 来 报 括 ,那么 我 们 就 能 用 多 个 主 成 分 来 
代 关 个 恋 量 。， 宇 成 分 分 析 往 往 不 是 目的 ， 而 是 达到 茶 种 目的 的 
一 种 手段 ,因此 它 常 常 被 用 在 基 个 项 目 研究 的 中 间 环 节 , 例如 我 人 
在 第 七 宣判 剧 分 本 中 多 个 总 体 的 Fisher 判别 ,建立 前 = 个 判别 函 
狐 的 思想 就 是 主 成 分 的 思想 ， 又 如 第 八 章 上 聚 类 分 页 小 非 线性 欢 象 
法 的 选 代 中 二 维 空 间 的 初始 点 就 建议 采用 样本 在 头 两 个 主 成 分 上 
的 信 ， 在 本章 撤 后 一 节 主 成 分 回归 中 ， 则 是 净 主 成 分 分 析 应 用 于 
全 归 分 析 , 此 外 主 成 分 还 可 用 于 降 维 的 图 法 聚 类 ， 

从 图 1.1 的 直观 说 明 ， 大 致 可 以 看 出 主 成 分 的 降 维 思想 是 从 
篇 化 方差 , 协 方差 的 结 斧 来 考虑 的 ,与 此 种 思想 由 一 致 的 还 有 因子 
分 析 、 对 应 分 析 以 及 典型 相关 分 析 , 它 们 将 在 最 后 两 章 来 讨论 ， 


$9.2 总 体 的 主 成 分 


(一 ) 未 标准 化 变量 的 情况 
从 几何 上 看 主 成 分 就 是 把 变量 wy，-……,*， 构成 的 坐 未 系 ,在 
一 定 约 束 条 件 之 下 进行 一 个 旋转 产生 的 新 坐标 系 中 的 若干 个 代表 
了 具有 最 大 变 异 方面 的 新 坐标 轴 , 从 代数 的 观点 告 , 主 成 分 是 ?个 
变量 mm :xp 的 一 种 特殊 的 线性 组 合 。 主 成 分 握 供 了 协 方差 阵 
萝 一 钟 简洁 的 表示 ,后 面 我 们 将 会 看 到 主 威 分 仅 依 赖 于 zi ,xp 
的 协 方 差 阵 人 或 相关 系数 阵 ) .并 不 变 求 分 布 是 正 态 的 ,对 于 正 态 总 
体 约 主 成 分 , 则 惜 助 于 等 密度 栅 球 还 可 给 出 许多 有 用 的 解 杰 . 
设 总 体 x 一 Cx" zf) 的 均值 风量 为 pj， 办 方差 阵 鸭 五 
考虑 线性 组 合 : 
yy x ut 二 
y= x nt at 二 


(2.1) 


yp 一 {x pki tT pri pp 
市 随机 | 向 引 朗 揪 的 星 斋 , 电 约 有 


中。 


Var 站 一 并 人 一 下 2 sp) 2.2) 
covlyay El (is 1,2 ,Pp) (2.3) 
在 62.1) 中 的 ,sp 分 别称 为 一 Cx",#p》 的 第 一 主 
成 分 ,第 二 主 成 分 ,…, 第 上 主 成 分 ,如 果 它 们 满足 : 
《1 yi 与 yy(i 半 说 不 相关 . 
(2) yj 是 x 的 一 切线 性 组 合 中 方差 达到 最 天 的 ; 7 是 与 
和 不 相关 的 一 团 x 的 线 柱 组 舍 中 方差 这 到 最 六 的 ,…，y; 是 与 
?一 2 都 不 相关 的 一 切 的 线性 组 合 中 方 鞠 
达 寿 最大 的 ， 
(3) yi 一 上 x 的 系数 满足 1 一 1 (= 1,2,.…*,p). 
上 述 主 成 分 的 定义 中 第 C1 ) 却 第 C2) 条 的 含义 是 明确 有 的， 而 第 
(3) 条 就 在 于 不 致 村 使 vartyi) 一 co。 
下 而 主要 是 导出 i 及 如 司 选择 KCK < 之 P) 个 主 成 分 使 这 外 
个 主 成 分 概略 了 x 的 变异 的 大 部 分 。 
定理 2.1 设 总 体 一 (ooxp》 的 协 方 涛 阵 汶 工 ， 
和 区 0 为 其 特征 根 ， 和 ,ee 为 对 应 的 单 
位 北 正 交 特 征 启 量 , 刘 第 i 个 主 成 分 为 


y= eax= ert ernst -+ epixp C2.4) 
ft ,2 sp 
且 有 
Vay = a Be CO— i (人 一 1 2 {2.5) 
Coveyiop) ES eBe—= 0 (i (2.6) 


汗 ; 若 特 征 根 有 生根 ， 对 应 这 个 特 往 根 的 特征 向 最 组 成 一 个 
R? 的 子 空间 . 子 空间 的 维 数 等 于 重 根 数 , 在 子 空间 任 取 一 组 正 交 
坐标 系 、 这 个 坐标 系 的 单位 疝 量 就 可 用 米 作 为 它 的 特 和 向量 ， 这 
时 特征 向 量 的 识 靶 不 唯一 ,在 下 而 的 讨论 中 ,我 们 总 假定 已 选 定 其 
一 种 取 法 ， 

证 明 ”上 由 正成 分 的 定义 知 求 第 一 主 成 分 狼 系 数 上， 等 价 于 求 
使 得 21 达到 最 大 的 (在 {1 一 1 的 条 性 下 ), 很 据 第 一 章 的 


" 303 + 


定 迎 4.14 有 


max Si = 4 


niu=l 
县 站 上 一 @ 时 达到 最 大 ,所 以 


max EI = = ere Tm varty} = vartex) 
HE 


抒 尝 到 一 @ 且 ee 一 1 奖 亿 地 有 


max [El hi eriTett 一 War(y441) — Yarleir¥) 
让 上 E11 一 白 生 
Waa=l 


即 熏 到 fv 一 et 个 12 p11), enterti™ 1 
由 ei 与 @j(i 和 3 门 的 正 交 性 及 特征 很 的 定义 有 
cov(ysy) = ese — ee — iee— 0 

上 述 定 理 表 明 x 的 主 成分 是 以 三 的 单位 化 正 交 特 征 向 量 为 
系数 的 线 此 组合 ， 第 : 个 主 成 分 的 系数 是 对 应 于 第 ; 大 特征 根 4 
的 单位 化 特征 向 量 , 其 方 鞠 为 i. 

定理 2.2 设 总 体 过 一 《at ozxp》 的 协 方 甘 阵 为 了 ， 之 
他 宇 0 为 其 特征 根 ， 相 应 的 单位 正 交 化 特征 向 量 为 
err" "ep; 主 成 分 为 让 一 ext 一 1 2 op 则 


天 


>, "i— 六 和 C2.7) 


其 中 中 为 x 的 第 i 个 分量 x 的 方 莹 ， 即 王 的 对 基线 上 第 了 个 
元 索 ，1 为 ? 的 方 薄 。 
证 明 记 羡 一 fever et] 为 了 的 特征 向 量 抢 阵 , 则 
PP Phe, 


由 实 对 称 和 拍 阵 的 性 质 有 
P53P=DD 或 = PDP 

其 中 Di 一 diag(p Ap) 

而 


» 
Dj varCx) = tr3 tr PD,P’) 


。 96 « 


rr »s 
一 tfDiP'P) 一 tr 一 > 一 var(y) 国 


J4=1 tu] 
下 面 我 们 讨论 主 成 分 与 原 变 说 鸭 各 种 相关 系数 之 间 的 关系 : 
定理 2.3 设 x 的 蔚 纺 分 为 入 一 ex = 1 2 和 "3 六 。 用 
Plyisx47 站 示 y; 与 不 变量 x 的 相关 系数 , 则 有 


C1) pyisxt) = en Ve lo (ish 1,2*.+p) C2.8) 
其 中 ei 表示 @; 的 第 * 个 分 其， 


(2) > olexyrxD 一 圭一 12 (C2.9) 
(32 2 PFs) 1 CR 12, P) 《2.107 


证 上 明 ”由 相关 系数 定义 知 


covC ys xe) 
VvarCyi) 。W varGzb) 二 
记 人 = [etyis re) Toxp 表示 一 4 pp) 与 Xr 
xe) 的 相关 系数 矩阵 , 则 
y= Px NT Go Diicov(y,x)Dst 
其 中 Di 一 diag(2 ,46),D, 一 iag(o 而 
cov(y x}—= Peovtx)= PIT {SPY EDP’ {2.11) 
其 中 了 一 [el yes] 为 了 的 单位 正 交 化 特征 向 量 矩 阵 。 记 以 
四 一 D,iPp'Ds: {2.12Y 
由 《2.122) 稍 示 的 y 与 x 的 相关 系数 矩阵 的 (i 成 》 元 素 正在 
《2.8) 式 ,所 以 (1) 香 证 
记 工 一 @D,3， 则 有 
TT’— @Dg ~ D, iP’'D; iD, DiPD,i = DIiP'PD i- D, 
(2.13}- 


oCyisra) 一 


而 了 一 BD,D 的 对 第 线 的 第 i 个 元 素 正 是 
» 397 = 


F 
> ， alp Cys #4)s 
R=l 


明 (2.13) 恒 可 看 出 (2.9) 式 成 立 , 即 (2) 得 证。 
又 由 
pp = DPD SD SPD DAED ER (2.14) 

上 上 式 中 的 及 是 x 的 相关 系数 矩阵 , 其 对 角 线 元 素 为 1， 而 BF 的 
第 下 个 对 有 角 线 元 索 为 prCyisxi)， 由 C2.14) 便 可 看 出 (2.10) 成 
了 , 针 《321 人 3 证。 国 

刊 有 六 成 分 的 主要 具 的 是 降 维 ， 所 以 一 般 情 读 下 要 选取 玉 
CK 之 p) 个 主 成 分 来 代 替 原 ?个 相关 变量 的 研究 ， 天 应 取 几 天 
班 ? 人 ?个 变量 所 提供 
信息 的 大 训 分 。 为 了 说 明 各 主 成 分 y; 概括 原 变量 信息 的 大 小 ,我 
们 通 馆 用 


a 
? 


7” 
来 点 孙 , 并 称 它 为 让 或 分 轧 的 方差 页 献 率 ,而 称 > 。 为 前 & 个 


主 成 分 的 和 累计 方差 贡献 率 .因此 主 成 分 个 数 扩 的 大 小 就 由 累计 商 
责 率 来 确定 ， 一 般 情 况 下 取 玉 使 得 票 计 页 献 率 达到 80% 以 上 ,其 


(T. :106% > 汪 80%， 


累计 和 贡献 率 是 表达 了 关 个 主 成 分 概括 了 原 变量 wy, -xs 的 
嘿 少 信息 ,和 但 它 溉 有 表达 某 个 变量 x; 被 破 括 了 多 少 信 息 ， 为 此 
我 们 引进 另 一 个 概念 : 天 个 主 成 分 y，,'……,yx 对 原 变 量 ## 的 页 
就 率 ， 这 个 贡献 率 是 用 xi 与 (y1,--" yx) 的 复 相关 系数 的 平方 
来 衡量 并 把 它 记 为 tz， 如 何 计算 zt; 蝶 9 我 们 有 如 下 定理 ， 

定理 2.4 没 (Cy 人 YK) 为 天 一 《ma “Xp 的 前 下 个 


» 398 = 


末 


和 


- 主 扎 分 , 则 x; 与 《7 7?x) 的 复 相关 系数 的 平方 为 


想 


想 . 
Ti pa rR] DY hecho — Dy pie) (2.15) 
1=4 


证 明 ” 状 谍 向 量 (四 ,各 了 ， 其 中 玉 二 yx 是 和 
一 (sy 的 玲子 向 量 , 于 荐 有 
cov( 洒 一 diaglh,--- Ar) 
由 {2.11) 式 得 到 
oa = covCrisB) oe Cen de shxeiry 
由 第 二 章 复 相关 的 公式 求 得 
Px Ps Yr) 一 全 [Toov( 多] tafo} 


KE . 

Wp 2 

一 > ， ie er 
#1 


这 就 证 明了 (2.15) 式 的 第 一 个 等 号 ， 第 二 等 号 直接 由 (2.8) 式 立即 
可 得 . 

在 实际 应 用 中 为 了 方便 于 对 主 成 分 的 解释 往往 把 原始 变量 忆 
与 前 下 个 主 成 分 之 闻 的 相关 系数 以 及 复 相关 系数 列 成 一 个 表 
《 见 表 2.1)。 

如 果 总 体 xX (Cx1, “ "xp 全 Np ECE > 0) 我 们 来 讨 
论 它 的 主 成 分 ， 正 态 总 体 的 等 密度 榴 球 为 (x 一 p73 (x 一 p》 
一 2 其 中 c* 为 常数 ,其 主轴 为 士 cW ii ai 和 一 1,2, ob。 这 里 
A 2 Ap > 0 为 了 的 特征 根 ，e,@,， ~ 为 相应 的 
单位 正 交 化 特征 向 量 。 为 了 方便 不 妨 设 pg 一 9, 记 了 一 (ea 
es)， DL 一 diagC44y"*"45)。 了 从 而 有 


如 
一 PDiiP' = >) ee 


i=1 


于 是 


ap . 
bY 9X2 ee oof soe 
ET 
a! i pry toa rolral 
PT oa oY ot 
iT ai yin 1pM1a Tntlst raltsyt 
PS 0 “" oaty oe 
» 
HE i i 


COM A lg 


从 次 滩 关 悼 角 屠 革 当 与 如 车 王 


T 7 其 


证 没 期 叶 


时 400* 


而 ex,(i 一 1,2,°"",p) 是 省 的 主 成 分 yi 所 以 有 
3 二 | (2.16) 
因为 4 > 05 二 1,2,……,p。(2.16) 是 以 主 成 分 ysi 一 1,2，-…， 
pt 为 主轴 的 一 个 椭 球 ， 其 方向 分 别 为 et = E27 sp. 因此 对 
于 正 态 总 体 ,等 密度 椭 球 的 主轴 方向 就 是 主 成 分 。 
(二 》 已 标准 化 变量 的 情况 
设 总 体 变 量 x 进行 标准 化 , 即 


其 机 ma DSCx 一 共 ) C2.17Y 
其 中 Do 一 diag(oi,-- 03;)，p 为 的 均值 向 量 。 显 然 x” 的 
均 信 府 量 为 0 疝 是 ,是 x* 的 协 方 差 阵 就 是 x 的 相关 知 降 R.。 x* 
的 主 成 分 能 从 cor(x*) 一 RR 的 特征 向 量 获得 ， 且 在 (一 ) 中 的 结 
论 者 成立， 所 不 同 的 基 , 由 于 var(x*?) 一 1 一 1 2 -bp。 前 面 
定理 的 形式 变 得 简单 一 些 ， 
定理 2.5 对 于 标准 化 变量 x* 一 【zz 在》 ， 其 协 方差 阵 
为 covkCx 和 一 民 。 它 的 特征 根 为 巡 关 过关- 汪 术 .相应 的 单 
位 化 特征 疝 量 为 看 ,-.+,。 则 有 


(1) x* 的 主 成 分 为 好 一 errx* 一 er Dj iCx 一 jp) 


(2) S var(yz) 一 vvar(xz) ~ porvarlyt) 4}. 
《3) plyF sz) oe rN (有 一 12。 


中 
(4) 2 oC, x) 一 1 {i= 1,2,...*,p) 
中 一 : 


Fp 
(5) py 一 上 Rl,2,. op) 
t=1 


《6) xf 与 前 玉 个 主 成 分 的 复 相关 系数 平方 为 


。407 。 


下 
px, Cy De. 
| 


例 2.1 设 x 一 (x,*2》 的 协 方差 阵 及 相关 系数 矩阵 分 别 为 


1 4 1 0.4 
zi ~ lo i] 
4 100 0.4 1 


容易 计算 2 的 特征 根 及 特征 向 量 分 别 为 
= 100.16, @ = C0.044,0.999Y 
is— 0.84, 外 一 《0.999。 一 0.044 了 
未 标准 化 变量 x 一 {《zrioxy 的 两 个 主 成 分 为 
4 一 .044x 十 0.999x, 
yi — 0.999x, 一 0.044x, 
计算 的 特征 根 及 特征 向 量 分 别 为 
xz C= 1.4, et = (0.707,0.707Y 
Nt = .6, er = (0.707,—0.707Y 
标准 化 变量 x* 一 《x?* ,x2?》 的 主 成 分 为 


y* 一 0707xt 十 0.707xy 一 0.707 (并) 


十 0.707 (a 


= 0.707C0 — pi) + 0.0707C2 — p2) 
y= 0.707x+ — 0.707x¥ 一 0.707 (2 ) 


一 0707 (本 二 全 
一 0.707(i 一 pp) — 0.0707 Cx, — pe2) 
由 于 xs 的 方差 很 大 , 它 几 平 完全 决定 了 从 Z 算 出 的 第 一 主 成 分 ， 
该 主 成 分 的 方差 贡献 率 为 一 99.2 锡 。 而 在 标准 化 的 情况 
下 ,地 与 好 的 方差 都 是 一 样 , 它 的 第 一 主 成 分 的 方差 贡献 率 为 
"402 | 


一 20 多。 从 这 个 例子 可 以 看 出 变量 的 称 准 化 与 否 对 主 成 分 的 


影 兢 很 大 。 以 第 一 主 成 分 为 例 ， 在 由 全 算出 的 不 成 分 六 分 别 与 


szz 的 相关 系数 为 ptyi;%1) 一 enor! 一 0.4404 和 ply1yx2)— 
23eaoi 一 0.9998 即 第 一 主 成 分 与 x 最 密切 。 而 及 算出 的 主 成 
分 六 与 二 ,x? 的 相关 系数 为 pC? 了 ,x 一 PC:x) 一 0.8365， 
遇 第 一 主 成 分 与 ** 和 地 一 样 密切 ， 所 以 一 般 说 来 ， 当 变量 取 
值 范围 德 时 邯 异 很 大 或 者 说 变量 的 量 网 不 同时 应 该 涛 虑 标准 化 . 
在 生物 学 .医学 中 许多 生物 量 ,xp 有 时 是 等 相关 的 , 它 


们 有 如 下 形式 的 协 方差 隆 和 相关 系数 阵 : 
orm + pr 1 PP --- Pp 
se pr Tr ,RR 一 ° 1 -只 
pr pr 2» Pp pr --* 1 


由 及 出 发 ,对 于 Pp > 0 不 难 求 得 (习题 9.2) 第 一 主 成 分 为 


1 有 
社 一 一 一 人 xy 


a :pi=1 


它 与 ?个 变量 成 比例 , 它 的 方 荣 贡 献 率 为 (p 十 上 二 全)X100%， 


当 p 接近 于 1 时 或 者 当 P 很 大 时 ,这 个 贡献 率 近 似 为 zp X 100 匈 ， 
所 以 当 p 茸 08 时 ,我 们 只 须 取 这 一 个 主 成 分 就 足够 了 、 

在 Seber[30] 的 书 中 介绍 了 主 成 分 的 其 它 形式 的 定义 。 从 主 
成 分 的 降 维 思想 出 发 , 我 们 要 用 一 个 KCK < p)》 维 向 量 y 来 代 
替 刀 维 向 量 x 的 研究 ， 而 且 y 应 尽 可 能 地 概括 x 的 变异 . 这 
就 是 说 ， 存 在 一 个 请 X 天 阵 了 ， 使 得 Fy 接近 x。 如 何 来 度量 
Fy 与 工 接近 程度 呢 ? 我 们 用 x 一 Fy 的 协 方差 阵 了 一 covr[(x 一 
Fy)] 的 一 个 函数 fCV》 来 衡 是 。 fC*) 是 定义 在 一 切 P x 了 阶 
非 负 定 集 侣 多 上 的 一 个 函数 且 要 满足 : 

亡 车 4，8 均 局 于 多 ,， 且 A4 守 8, 4B, 则 f(A)> 


s OF + 


1(B), 

ii 对 YA4e .多 ,PP 为 任意 的 P 阶 正 交 阵 ， 则 信 PAP) 一 
KA). 

满足 上 述 条 件 的 沙 数 亿 :) 是 存在 的 ,例如 f(A4) 一 trA ,f(D 一 
[tr44A1*,，Ae 多。 设 P 维 向 量 x 的 协 方差 阵 了 的 特征 根 为 
全 1 守 .…* 安 1 守 0， 相 应 的 特征 向 最 为 a,e,*-…,es。 令 
P™ [eses,***,e,] 一 [Pi;Pi]， 其 中 Pi~ [es***,er];, 央 P 
的 前 玉 列 组 成 的 请 X 玉 阶 托 阵 、 在 [30] 中 证 明了 FV》 当 Fy 一 
PiPix 时 达到 极 小 ， 


$9.3 样本 主 成 分 及 应 用 实例 


(一 ) 样本 的 主 成 分 

上 一 示 我 们 从 总 体 协 方 差 阵 三 驶 从 相 关系 数 第 阵 导出 和 应 
的 主 成 分 ,并且 不 需要 总 体 分 布 的 假设 ， 当 总 体 的 协 方 差 阵 3 
《或 呈 Rs 就 必须 由 样本 xj(i 一 1,2,.…,n) 的 协 方差 阵 


s— 4 :> (zxi 一 于 《xi 一 将)》 (或 让 ) 出 发 求 样本 的 主 成 


分 。 
对 于 任 一 线性 组 合 ixz。 相应 于 容量 为 #4 的 样本 - x 一 1， 
“…s8) 有 
Ux; = Ux hry 十 
其 样本 询 值 和 笠 本 方差 分 别 为 


地 “ti 


f=1 
Es tro tt Dm — SC — ay jv 
一 (Sl, 
尾 意 的 两 个 线性 组 合 Lx 及 fix， 对 应 于 xj(j 一 1,:.…,#) 的 
“了 


样本 协 方 差 为 
1 Hx Vai — Uay = 5 
jl 


类 似 于 总 体 主 成 分 的 定义 ,可 以 定 文 样本 的 主 成 分 如 下 : 

样本 第 一 主 成 分 入 一 和 xz 是 满足 75 一 1, 且 使 得 xjCj 一 
1,2。-……,#n》 的 样本 方差 [Sl 最 天 的 x 的 线性 组 台 。 样本 的 第 
二 主 成 分 和 二 Lx 是 满足 1 一 1 及 xi 与 xi mm 1 2 
#) 的 样本 协 方 其 L131, 一 0， 而 且 使 得 Lxj(j 一 1,2,-*-,#) 的 
样本 方差 {8Sl, 最 大 的 x 的 线性 组 合 ,…， 一 般 地 ， 样 本 的 第 i 
二 成 分 和 一 [x 是 满足 li 一 1 及 ji 与 xj (过 i,j 二 

+ 的 梯 本 访 方 差 lst 一 门 ， 下 使 得 LixiCi 一 1， 

狼 照 上 面 样本 主 成 分 的 定义 ， 容易 看 册 也 有 相应 于 上 节 的 定 
图 3.1 一 定理 2.4。 只 不 过 是 用 样本 协 方 差 隆 8 代替 了 总 体 的 协 方 
六 阵 了 里 了 ,样本 相关 系数 代 芝 了 总 体 相关 系 狼 ， 样本 主 成 分 代 准 
总 体 主 成 分 而 已 。 

如 果 样 本 已 标准 化 了 , 即 x* 一 D7iCxy 一 ,Cf 一 1,2,.…-， 


#), 其 中 一 三 >) js D,— diag{ ss sa» > I 为 Xi 一 
于 四 了 


1,2,-**,#) 样本 方差 阵 的 对 角 线 元 素 。 记 X 一 (xysxyr--y 
xX} 让 示 村 个 样 吨 组 成 的 标准 化 资料 阵 ， 1 一 (1,1 i 1 了 了， 那 
人 么 标准 化 了 的 样本 询 值 向 量 为 


2 一 上 X*1e0 
及 


样本 的 旋 方 差 阵 为 
5 一 工 (x* 一 上 Ex) {x 一 二 X*11’ ) 


bi 


= 六 [Po 站 x* 1 CK* —_ 下 这 mm 二 一 四 
4 


”Se 


虽 标 谁 化 的 样本 协 方差 阵 就 是 祥 本 相关 系数 宅 阵 ， 因 此 在 上 面 样 
本 主 成 分 的 定义 中 以 相关 系数 年 阵 让 代 检 5 人 恒 可 得 到 标准 化 的 
样本 主 成 分 定义 。 相应 地 也 有 上 一 节 的 定理 2,5, 内 不 过 是 以 让 
代替 总 体 的 相关 系数 阵 呈 轩 了 。 

当 样 本 中 各 变量 之 间 量 纲 不 同 , 即 取 值 范围 彼此 差异 很 大 时 ， 
就 应 该 考虑 将 样本 数据 先 标 准 化 再 计算 样本 主 成 分 . 

(二 ) 总 体 主 成 分 的 估计 及 其 有 关 栓 验 

上 一 段 中 我 们 是 用 样本 协 方 差 阵 5 (或 相关 降 请 ) 代 赫 总 体 
的 滩 方 差 阵 (或 相关 阵 R》 求 特征 根 与 特定 向 量 ， 并 获得 总 体 
主 成 分 y 的 值 计 让。 自然 要 间 $ 的 特征 根 及 特征 向 量 是 否 为 在 
某 种 意 以 下马 的 特征 根 及 特征 尚 量 的 估计 ? 我 们 将 以 正 态 总 体 的 
情况 来 讨论 此 问题 。 

设 xxz 是 内 Nlp，, 了 》 中 抽取 的 容量 为 4 的 样本 ， 


(TF 0,n pp),i 三 一 二 3 过 一 (xi 一 四 (oz 一 元 外 
t=l 


f=1 
则 pj 和 三 的 最 大 似 然 估 计 是 过 和 二 4. 
Okanoro 在 1973 年 证 明了 当 “> 请 时 , 4 以 概率 1 正定 且 4 
的 诸 特征 根 以 概率 1 互 不 相同 。 设 5 一 二 4 的 特征 委 为 mm> 


22 之 之 vw 这 0， 相应 的 单位 化 特征 向 量 为 YY)， 
iET ~ (YY,,- ,YD,—diagty,* ” ‘vp 由 于 Y; 和 —Y; 
都 是 v; 相应 的 特征 向 量 , 为 了 确定 性 ,我 们 要 求 Yi(i 一 1,2,…， 
) 的 各 分 量 中 第 一 个 不 为 0 的 分 重 取 为 “十 " ,那么 yY， 就 唯一 苞 
定 了 ,从 而 工 也 唯一 确定 。 

定理 31 设 x,,…,xs 是 总 体 NC, 2) (BF >0,n> pp) 
的 样本 , 且 Z 的 诸 特 征 根 答 不 相间 , 设 这 入 之 -… 之 和 之 0 为 
其 特征 根 , 相 应 的 单位 化 特征 向 量 为 6,-…,e, 且 它们 的 第 一 个 
不 为 0 的 分 量 为 十”, 则 为 和 @j(i 二 1,2，-…,8) 的 极 大 似 然 估计 
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分 别 为 $ 一 二 4 的 特征 根 »， 及 符 征 商量 Yi 一 12 8》 

证 明 ”由 于 5 的 诸 特 征 根 4 互 杀 相同 ， 且 相应 的 单位 化 特 
征 向 基 @; 的 第 一 个 不 为 0 的 分 量 为 “十 ”, 记 P 一 (e, ,es)， 
Di 一 diagfk24 -1p), 从 而 D， 和 P 卫 由 唯一 确定 , 凤 D, 和 P 
是 瑟 的 单 值 函数 ,而 3 一 二 4 是 3 的 极 大 似 然 估 计 ， 再 由 第 四 章 
引 理 2.1 ,负极 天 似 热 估计 不 变性 知道 8 的 相应 转 征 根 v， 与 特征 
向 量 Y; 是 有 醒 而 的 极 大 位 然 佑 计 ， 目 

由 于 十 A 不 是 的 无 偏 估计 ,在 实用 常用 3 一 -一 -4 的 
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特征 根 与 特征 向 量 作 为 2 的 特征 根 与 特征 向 量 的 估计 ， 
上 述 定理 的 证 明 是 设 2 了 没有 重 根 ,， 若 王 有 年 根 , 例如 一 
di Er 个 生根 ,可 以 证 耶 它 的 角 大 似 然 估计 为 


上 允 ) wej。 至 于 特征 向 量 只 能 在 某 种 意义 下 看 成 极 大 似 然 估计 。， 
j= . 


关于 yi 及 Yi(i 一 1,2,-…,p) 的 分 布 有 下 面 的 浙 近 结果 ， 
它 的 证 明 在 17][13] 中 大 较 详 细 的 讨论 ， 

定理 32 设 xx。 是 N,Cp;, 了 XE > 0,n 之 p) 的 样 
本 ,其 中 gg, 未 知 ， 生 闫 如 芝 … 为 时 的 特征 模 , 相应 的 


特征 向 量 为 e;,&,:…- ,es。 记 样本 3 一 一 1 -4 的 特征 根 为 


v1 之 V1 之 ，… 之 wv,> 0， 相 应 的 特征 向 量 为 ¥1,(i 一 1,2,…， 
p)。 则 有 . 

(i) 如 果 三 的 特征 根 互 不 相等 , 当 = -> co 时 ,wW # 一 1 (vi 一 
4D)1C24D3 Ci 一 1,2,-…,p)， 渐 近 地 相 互 独 立 且 依 次 浙 近 地 服 
”从 NC0,1). 即 使 劝 有 重 根 ,只 要 的 第 i 个 特征 根 是 单 根 , Vn 一 1 

《31 一 1)1(2 和 33 仍 新 近 地 服 从 入 (9,1). 
(ii -如果 卫 的 特征 根 互 不 相等 ,那么 当 = 一 oo 时 ， 
V1 6) 全 一 1:2) 


和 
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渐 近 地 服从 均值 向 量 为 0, 协 方差 矩阵 为 


开 ; 由 
fe Ch 


r 
i 


的 尹 维 正 术 分 布 。 . 

前 面 也 曾 讨 论 了 主 成 分 的 个 数 玉 的 取 法 ， 即 前 下 个 特征 根 之 
和 应 占 金 部 特征 根 之 和 的 绝 天 部 分 ， 如 果 从 假设 检验 来 提 这 个 癌 
题 ,就 是 要 检验 假设 


hh: tan nT Tie 0, (3.1Y 
Hi 人 一 天 十 1 3p)》 不 全 为 
更 一 般 地 提 法 是 
Ho: hx ™ "4, 4, 


一 天 二 1) 不 全 相等 (3.2) 

定理 3.3 设 ly ys 是 Np ) 《ZF > ,n> Pp) 的 样 

本 ， 下 和 了 未 知 ， 了 的 特征 根 为 1 六 和 之 四 > 1 样本 访 方 
关 阵 5 一 本 二 一 4 的 特征 根 为 ws 之» > … 之 v。， 检验 假设 


(3.2) 的 似 然 比 统计 县 为 


如一 (HI» /ZE se) | 
此 定理 的 证 明 可 参看 [13], 
James 1969 年 [13] 给 出 它 的 渐 近 分 布 , 令 


名 一 一 人 一 1 一 天 一 全 [2 — K+ 2 K+ 


十 多 5) 一 人 ap 
tl 
它 浙 近 地 服从 自由 度 为 了 一 FP— Kp— K+ 1) 一 1 的 * 


分 布 ,其 中 一 一 -一 >， wm。 对 于 给 定 显著 水 平 < 当 六 > 


PK K+ 
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Rf) 时 拒绝 于. 

在 实际 应 用 中 ， 样 本 主 成 分 的 个 数 下 的 选取 仍然 采用 总 体 主 
成 分 的 办 法 ,即使 得 前 下 个 样本 主 成 分 的 贡献 率 达 到 80% 以 上 、 

(三 》 实例 

例 3.1 基 沉 积 盆地 有 一 圭 陷 区 对 十 七 个 点 进行 了 勘探 ,每 一 
个 点 测定 了 六 个 地 质变 量 : x 一 有 机 碳 (%)，x 一 生 油 居 埋 深 
( 米 ), 一 油层 和 孔隙 度 ( 锡 》,xs 一 储 层 厚 度 ( 亲 ), 六 一 地 下 水 合 
融 量 (p.p.m 3，%* 一 地 下 水 矿 化 度 ( 克 / 升 )，。 由 于 地 质变 量 的 单 
位 不 一 梯 ， 取 值 藻 围 酸 殊 很 天， 例如 有 机 碳 取 值 在 0.2~1.5 郁 之 
闻 , 生 扣压 埋 深 则 在 1200~ 3200 米 之 间 , 因 此 将 原始 数据 标准 化 ， 
并 列 在 表 3.1, 我 们 要 对 六 个 地 质变 量 进行 主 成 分 分 析 ， 其 目的 有 
两 个 :中 找 出 综合 地 质 因 素 与 地 质变 且 的 关系 ; 名 利用 主 成 分 将 
17 个 勘探 点 进行 分 类 为 邮 质 类 比 提 供 良 据 。 下 面 是 计算 和 分 析 
步 又 : 

ti) 根据 表 3.1 的 标准 化 数据 ， 计 算 六 个 变量 的 要 关系 数 矩 
阵 契 , 列 于 表 3.2.。 

《ii 计算 相关 系数 拭 阵 让 的 特征 根 及 相应 的 单位 化 特征 向 
量 , 列 于 玫 3.3， 表 中 还 列 出 特征 根 的 累积 百分比 。 

(iii》 从 表 3.3 可 看 出 六 的 前 两 个 特征 根 的 累积 百分比 已 达 
81.2 多 , 即 前 丽 个 主 成 分 的 贡献 率 已 达 81.2 儿 , 故 取 两 个 样本 主 成 
分 如 下 : 

[和 一 ez 一 站 49072 十 0.4974x; 一 0.0951%, 

十 0.0718x4 十 由 50182x5 一 0.4957x¢ 
ph ex 01882x 十 0.0418zx, 十 0.6148x， 
十 0.7484z; 一 0.1282xy 二 0.0889x, 

Civ) 计算 两 个 主 成 分 与 六 个 原 变 量 的 相关 系数 及 每 个 变量 
与 两 个 主 成 分 的 复 相关 系数 并 列 于 表 3.4。 

(Y)》 根据 天 3.4 的 数据 可 以 看 出 第 一 主 成 分 与 *,《 有 机 碳 )， 
习 《 生 油 层 埋 深 )， 妆 《地 于 水 合 奢 量 )，x 《地 下 水 矿 化 度 ) 这 站 
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表 3.2 六 个 地 质变 量 的 相关 系数 阵 由 


wl] TT, 于 4 EF bi C7 
x 1,0000 
zi 0.8402 1.0000 
x 一 0.13139 -0.058 .1.0000 
二 有 -3 和 4 0.0775 0.1521 1.0000 
zs D8395 D9388 一 说 .1942 一 0.037 .0000 
ER — O8594 一 0-8631 0.205] .0286 一 0.8790 -1.0008 


图 3,1 也 两 个 主 成 分 为 坐标 加 17 沾 点 的 分 类 饼 


全 变量 特别 密 (其 中 与 xs 旦 显著 的 负 相 关 》，, 而 这 些 地 质变 量 的 结 
合 大 致 反映 了 “ 生 泪 条 件 " 这 个 综合 地 顾 尖 索 , 因 此 主 成 分 办 是 “ 生 
油 ” 因 素 。 第 二 主 成 分 与 z,“ 油 层 孔 陵 度 )，*%《 储 野 厚 度 ) 特 别 
密切 ,这 两 个 地 贰 变量 相 结 合 大 致 反映 了 “ 储 放 条 件 "这 个 综合 地 
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质 困 素 ,因此 主 或 分 加 是 “ 储 油 * 因 素 ， 以 上 分 析 与 石油 地 属 理 论 
是 相符 合 的 ， 

Cvi》 要 对 17 个 勘探 点 根据 两 个 主 成 分 进行 分 灼 。 将 表 3.1 
的 17 标准 化 样品 数据 分 别 代 人 主 成 分 3.2? 式 ， 计 算出 每 个 点 的 
两 个 主 成 分 值 。 计算 结果 见 表 3.5, 以 入 和 用 分 别 作为 横 举 标 
和 级 坐标 ,然后 将 17 个 样品 点 在 坐标 系 加 OF: 上 点 图 ( 见 图 3.1). 
从 图 3.1 可 看 出 17 个 勘探 点 可 和 分 为 四 种 类 型 ， 它 与 实际 情况 基本 
符合 。 

例 3.2 Stone (1947) 利用 了 Kuznets 和 Barger 所 收集 的 
美国 1922 ~1938 年 有 关 国 民政 入 与 支出 的 17 个 要 素 的 数据 ， 这 
些 要 素 包 括 纯 公共 支出 , 净 增 库存 ,股息 .利息 及 外 留 平衡 等 等 , 它 
们 是 按 美 元 计算 、 但 变量 的 标准 差 变 化 相当 大 ， 因 此 进行 了 标准 
化 ,从 相关 矩阵 出 发 ,对 17 个 要 索 进 行 了 主 成 分 分 析 , 并 且 提 取 了 
三 个 主 成 分 ,第 一 主 成 分 的 贡献 率 为 80.76 多 ， 第 二 主 成 分 的 贡献 
率 为 10.59 多 ,第 三 主 成 分 的 贡献 率 为 6.09 罗 。 三 个 主 成 分 总 的 页 
献 率 达 到 97.44 朝 。 显 然 ， 这 三 个 主 成 分 用 平 概括 了 17 个 经 济 变 
量 的 变异 ,因此 有 效 维 数 从 17 维 降 到 3 维 ， 从 而 达到 主 成 分 分 析 
的 目的 ,但 如 何 解 县 这 三 个 主 成 分 呢 ? Stone 根据 经 济 学 的 理论 和 
知识 ,他 认为 变异 是 由 三 个 要 素 组 成 : 〈1) 总 收入 :或 其 些 类 似 的 
量 ,(2)z 的 变化 率 Lx、(3) 经 济 发 展 与 衰 返 的 趋势 项 ,该 趋势 项 


开 3.6 三 个 主 成 分 与 单 狼 可 测量 的 z,4z,t 之 间 的 相关 系数 矩阵 


$2 性 雷 EE r 


可 雇 取 作 时 间 # 的 线性 项 ,因而 这 三 个 要 素 可 以 单独 测 辣 ，Stone 
将 三 个 主 成 分 有 办， 与 x Le 计算 其 相关 系数 ， 其 结果 列 
丁 表 3.6。 

从 表 3.6 中 可 以 看 出 名 与 *， 轴 与 4s 妆 与 : 有 着 很 大 的 相 
关 关 系 , 而 x,4x, +? 之 间 相关 性 较 小 ， 因 此 三 个 主 成 分 实际 就 可 
解释 成 xyd4z 和 1， 这 三 个 要 素 ， 


“9.4 主 成 分 回归 


(一 ) 问题 的 提出 及 复 共 线性 

在 回归 分 析 中 ,回归 系数 的 最 小 二 乘 舍 计 (LIL.S 估计 ) 具 有 许 
多 优良 性 质 ,其 中 最 主要 的 是 Gauss-Markoy 定理 , 它 保 证 了 工 .S 
估计 在 线性 无 偏 估计 类 中 的 方差 最 小 性 。 如 果 进 一 步 假 设 误差 服 
从 正 态 分 布 ,那么 L.5 估计 还 具有 更 多 的 优良 性 质 ， 忆 此 工 .5 估 
计 一 站 被 广泛 地 应 用 于 回归 系数 的 估计 ， 但 随 着 电子 计算 机 的 发 
纤 和 普及 ， 人 们 越 来 越 多 地 处 理 含 较 多 髓 变 攻 的 回归 问题 。 同 时 
在 实 路 中 也 发 现在 一 些 情况 下 , 工 .8 估计 并 不 很 理想 ， 甚 至 很 不 
好 。1955 年 Stein 指 负 了 , 当 维 数 绢 > 2 时 正 态 均值 向 量 的 工 .S 
信 计 的 不 容许 性 ， 即 能 够 找到 另 -一 个 估计 在 某 种 意义 下 -一致 优 于 
L.S 估计。 之 后 人 们 开始 寻找 新 的 估计 ,其 中 主要 有 主 成 分 估计 ， 
岭 估计 ，Stein 估计 及 特征 根 估计 。 而 主 成 分 估计 是 根据 我 们 前 
面 介绍 的 主 威 分 为 背景 引进 的 ， 本 节 主 要 就 是 介绍 主 成 分 估计 回 
归 系 数 的 方法 ,上 面 提 到 的 各 种 新 的 估计 有 一 个 共同 点 ,就 是 有 偏 
性 , 即 估计 量 的 数学 期 望都 不 等 于 待 估计 的 参数 ,因此 这 些 估 计 统 
称 为 有 偏 估计 。 

由 上 面 的 叙述 ,自然 要 提出 在 什么 情况 下 L.S 估计 的 性 质 才 
明显 地 变 坏 ? 为 此 ,我们 提出 一 个 度量 估计 优 劣 的 另 一 个 标准 : 
询 方 误差 (Mean Square Error， 简 记 为 MSE)。 对 于 一 般 的 参 
数 估计 问题 , 设 9 为 ? 维 未 知 参数 向 量 ,而 向 量 6 为 它 的 某 种 佑 
计 ， 的 均 方 误差 定义 为 


= 415 + 


MSELE) 合 FE 站 一 6: 一 了 (站 一 日 (站 一 6 (41 
它 度量 了 未 知 参数 日 与 集 倚 的 大 小 ， 一 个 好 的 合计 应 该 有 较 
小 的 均 方 误差 ， 为 了 更 好 地 理解 MSECO) 的 意义 ， 将 它 进行 分 解 
MSE(O) 一 E(6 一 976 一 6) 
— FE[(6— EB + (CE6— OIC EO + CEE)1 
一 下 (和 一 506 一 E6) + £6 — ol 
一 trcov( 和 ) + IE — OA4 + 4 (C4.2) 
若 台 的 个 分 量 记 为 (i 一 1,-…,p)， 则 


入 | 一 treovCBy 一 六 var 本 (4.3) 
— IE — Ok — SCE6,— 6) (4.4) 
. tml 


由 C4.3) 和 (4.4) 可 以 看 出 它们 分 别 是 生 的 各 分 量 的 方差 之 和 以 及 
仿 差 的 平方 和 ， 如 采 后 是 9 的 无 偏 估 计 , 则 MSE(§) 一 4, 确 
实 存在 一 些 8 的 估计 量 站 ， 尽 管 对 它 而 音 小 头 0, 但 MSE() 
却 较 小 ,我 们 将 把 注意 力 放 在 这 些 佑 计 工 ， 

下 面 考虑 第 六 章 中 已 讨论 过 的 线性 回 妇 模型 


1 。 
一 (are) ( i) + (C4.5) 
其 中 基 一 (x,，- ,xX。)》 是 了 XX # 样 本 算 阵 ，Z* 是 中 心 化 后 的 
9 关 # 和 年 阵 , 即 它 满 足 Z*1,. 一 0,8* 是 了 次 了 的 未 知 参 数 算 阵 ， 


Es—0, coviveee } — ZO, rk(2*)— g. 
正如 第 六 章 第 一 节 所 讨论 的 : 


色 一 元 一 1 > Xi, Oo— XZ* (Z+Z*)- 
是 相应 的 m 和 @* 的 L.$ 估计 。 若 考虑 6* 的 均 方 误差 ,如 通 


常 一 样 可 定义 MSE(8*) 一 MSE(vec@+)。 
类 似 于 第 六 章 定理 1.2 容易 证 明 
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cov(vecGB*) — TOLZ+Z*N 
由 于 
EG@* 一 EXZ*(Z*Z*) i Cl 团 * 世 本] 人 (区 本 区 和 G+* 
可 知 6@* 是 @* 的 无 偏 估计 ,而 人 @* 的 均 方 误差 正 是 
MSE(B*) = d= trcov(vecg*) = tr[ZO(Z*Z* YH] 
ZE 
由 于 Z*Z* 的 正定 性 , 则 存在 正定 阵 P 一 〈e , -… -er) 使 得 
ZrZA PDP’ 
其 中 D; 一 diagClis -07 4 是 2*Z* 的 第 i 个 大 的 转 征 
根 ,于 是 


MSE(6*) = tr >) A 


和 如果 Z*Z*” 中 至 少 有 一 个 特征 根 非 常 接近 于 0, 那么 MSE 
(6*) 变 得 非常 天 ， 因 此 从 均 方 误差 角度 来 看 6* 不 再 是 @* 的 
一 个 良好 估计 ， 

如 果 Z*Z*” 至少 有 一 个 特征 根 接近 于 零 ， 我 们 称 设计 上 挎 阵 
Z* 用 现 病 杰 , : 即 当 设计 和 矩阵 Z* 星 现 病态 时 ，L.3 估计 性 质变 
坏 ， 容 易 证 明 : 当 2Z* 呈现 病态 时 , 它 的 行 向 里 之 闻 存 在 着 近似 
的 线性 关系 。 事实 上 车 记 2Z* 一 (xh,… "zx5)》，Z*Z* 的 第 i 
个 特征 根 4 == 0， 相 应 的 特征 向 量力 e;， 于 是 

2Z*2* eo Lie = 0。 
由 lz*'el 一 eiZ*Z*'@; = 0 可 得 
Z*'@, 20 
记 ai 一 (en，-…@,》， 上 式 可 写成 
enzty Tt eens iz = OD C4.7) 

《4.7) 式 说 明了 设计 给 阵 Z* 的 行 向 量 有 近似 线性 关系 ,相应 
地 称 设计 第 阵 Z* 或 者 线性 模型 (4.5) 存 在 着 复 共 线性 。 关于 复 
共 线 性 的 严重 程度 的 度 攻 已 提出 了 一 些 行 之 有 效 的 方法 ， 这 里 介 
绍 一 种 特征 分 析 靶 。 
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设 2* 至 现 病态 , 则 Z*Z* 至 少 有 一 个 特征 根 接近 于 玲 , 不 
妨 没 后 面 一 + 个 特征 根 2 2 接近 于 零 ， 相 应 的 标准 化 
特征 向 量 为 ”e+ -…yey。 由 (4.7) 式 知道 存在 4 一 上 个 复 共 线 关 
系 Z*e; 一 0Ci 一 + 十 1,…-,9). 即 2*Z* 有 多 少 个 特征 概 接 
近 于 有 零 ,设计 矩阵 Z* 就 有 多 少 个 复 共 线 关 系 式 ,然而 Z*Z* 的 特 
征 根 接近 于 霉 是 一 个 模糊 的 慨 念 ,在 应 用 上 ,我 们 引入 一 个 条 件数 

Ce A hee 

络 验 地 认为 ; 车 0 二。 三 100， 认 为 不 存在 和 沉 共 线性 , 若 100 所 
c 所 1000 则 认为 存在 中 等 或 较 强 的 筑 共 线性 , 若 < > 1000, 则 认 
为 存在 严重 的 揽 共 线性 , 

(二 ) 回归 勾 数 的 主 成 分 估计 

主 成 分 估计 是 Massy 于 1965 年 握 出 的 改善 L，8 估计 的 一 
种 有 偏 估计, 其 背景 是 先 求 出 原 自 变量 的 主 成 分 ,然后 再 求 出 因 变 
量 与 主 成 分 之 疝 的 回归 系数 ， 

我 们 考虑 的 回归 模型 仍 为 (4. 人 .假设 设计 矩阵 Z* 已 中 心 化 ， 


常数 项 we， 用 至 一 三 I x; 来 估计 , 记 丸 一 chi(2*2Z* 仆 为 2+ 


Z* 的 第 i 大 的 特征 根 , 相应 的 标准 化 正 交 特征 向 量 为 @1,** es， 
i P= (0,..,e). 

如 果 把 模型 (4.5) 中 的 4 个 自 变 量 zx。 看 成 4 维 随 机 疝 
量 5， 那么 设计 矩阵 Z* 一 (zY,,…,z+) 的 *+ 个 列 向 量 就 是 随 
机 向 重 的 * 次 观察 值 ,由 于 已 中 心 化 ,那么 5 一 二 一 2* 2 
就 是 z 的 样本 协 方差 阵 (注意 到 Z*Z* 与 3 有 相同 的 特征 向 
量 )。 设 对 于 z 的 * 个 观察 值 矩 降 Z* 的 样本 主 成 分 向 量 为 & 一 
(gr***s 4s) ， 其 中 

i= ez (一 1 39) (4.8) 
其 中 是 5 或 2*2Z* 相应 于 y 一 ch(Z*Z*) 的 标准 化 特征 
向 量 。 而 第 j 个 观察 向 最 zy 产生 的 主 成 分 向 量 值 为 
了 


(Pa Ge 4.9) 
e; 


从 而 由 设计 知 阵 Z* 产生 的 主 成 分 设计 御 儿 可 记 为 


个 一 PZ (gi Des (4.10) 
注意 到 避 仍 为 4 x # 阶 矩阵, 共 令 
一 3*P . C4.11) 
可 净 回 归 模 型 (4.5) 改 写成 , 
区 一 CE 8 C4.12) 


关于 s 假设 不 变 , 上 式 仍 为 回归 模型 的 洪 则 形式 ， | 
如 果 设 计 握 阵 Z* 呈现 病态 , 那么 Z*Z* 的 特征 根 至少 有 
一 个 很 小 ,不 妨 设 后 9 一 了 个 很 小 ， 即 zt 14 近似 于 堆 . 这 
时 候 后 2 一 7 个 新 变量 ( 主 成 分 》 8 8 在 # 次 试验 中 取 值 
变化 很 小 ,这 可 如 下 说 明 : 
由 于 2* 已 中 心 化 , 所 以 Gl1 一 PE 一 0，G 也 已 中 心 
化 了 。 于 是 变量 8 在 ?次 取 值 波动 为 
(81 一 有 一 人 Bo 一 时 Ze 一 0 
这 
其 中 @ 一 《go “By, gn 一 ez De 
于 是 这 些 新 变量 的 作用 可 合并 人 常数 项 ,无 三 天 局 我 们 可 将 
gr+ gg 从 模 迹 (4.122) 中 删除 。 
基于 上 述 思想 ,我 们 对 D;,a,G,P 作 下 列 分 块 
【好 
Di 一 0 pi , DP = diagChs eh) 
a = (Ca,0), Qi 为 9 Xr 阶 知 阵 
P= (P,P;), Pj 一 (ee) 为 9Xr 阶 绒 阵 


La 
6 一 )， Gew 一 PiZ* 为 + xz 阶 矩 阵 。 
Gy . 
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于 是 《4.127 订 改写 为 

时 一 Cl 十 本 Go 十 的 * Go 十 C4.13) 
上 上 述 剔 除 g.41,-**g， 的 过 程 也 即 用 弘一 0 估计 号 。 于 是 可 得 
到 . 


天 一 dl 十 Go 二 8 
由 Go 一 PiZ* 1 一 0， 即 新 谈 计 些 阵 G， 也 已 中 心 化 ， 压 与 
模型 (4. 外 一 样 可 得 a 的 L,S 合计 为 
在 ™ 天 GCCGeaoGoa 《4.T4 
由 于 Go 一 PiZ* 以 及 
A 站 
p'Z*2*°p 一 (站 (Z*Ze P,P ) 一 © pg 
从 而 GoGo 一 DD ，(4.14》 可 写成 
f= KOMWDI™ C4.15Y 
注意 到 若 不 令 名 一 0， 而 是 按 通 党 方法 求 (4.13) 模 型 中 的 L.S 
估计 ,那么 乞 不 变 , 而 wm 的 L.S 估计 为 
a ™ XG DIY 
可 以 计算 得 到 cov(vec 起 ) 一 了 的 D2 息 的 每 一 分 量 的 三 甘 都 
非常 大 . 主 成 分 回归 的 关键 在 于 令 名 一 0， 使 得 到 的 a 的 估计 性 
质 有 较 天 改善 。 
利用 名 和 名 一 0 代 人 (4.110 式 得 到 原 模 型 C4.15) 的 参数 
B” 的 估计 为 


,p: _ 
Gr 一 iPp’ 一 Gao 一 XCoD-Pp， (4.16) 
; 


称 9” 为 6*” 的 主 成 分 估计 . 
主 成 分 估计 有 如下 一 些 性 质 : 
定理 41 设 6* 为 模型 (4.5) 中 人 参数 8* 的 王 .S 佑 计 ,6* 为 
号 ”的 主 成 分 估计 , 则 
GB* 一 6*. P,P; 
证 明 
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6* — XO DD Pp 一 XI* Pp DP! 
一 (ZZHNP, DNTP’ 一 +P DP’ » PD 'P, 
一 (PDDP: 十 PDEPYP DI 'P' 一 @*PP: 
上 面 最 后 一 步 利用 了 PiPt 一 1, 和 PP, 一 0, 目 
定理 4.2 记号 同 定 理 C4.1) 则 
: FO* 一 HB*PP; : 
即 当 ” 和 4 时, 主 成 分 估计 全 是 @* 的 有 偷 估计 。 
证 明 : 由 于 L.s 估计 6* 是 @* 的 无 偏 佑 计 , 故 
EG* — EB*PP; 一 @*PP; 
当 *< 了 时 PipPis 了 故人 6 是 @* 的 有 侦 估 计 。 量 
定理 43 当 设 计 和 矩阵 Z* 旺 静 病态 时 ,适当 选取 ” 可 使 得 
MSE(CG*) < MSE(CS*) 
证 明 记 关 一 《二 ,07?， 惠 用 (4.15) 
Di 0 ) 


a— Xo ( 
0 


; | Din 1 - 
tr[eovCvect)]) 一 “z@( ,0 ) 


— iT: Sn. 


fl 


另外 
[8vec 一 vecal: — vecf0vesyvecC0yay》 
一 ao,a( ， ) 一 aaa 


外 54.1567 
MSE(B*) 一 MSECEP’) — MSE(&) 
= tr[cov(vec&)] 十 Evec& 一 vecall: 


Us DF) H+ tra 


d= 
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， 
= MSE(CG@*Y) 十 (tae — ts* F127! 】 

C4.17) 

由 于 Z* 呈现 病 赤 , 至少 有 一 特征 根 授 近 于 零 ， 不 妨 设 后 4 一 + 


个 2 接近 于 零 。 此 尘 ZI 47! 将 非常 大 。 可 使 44.172? 式 第 二 项 


为 负 。 从 而 对 于 所 选 的 > 有 
MSEC6*) < MSECG*). 由 

定理 4.3 指出 从 均 方 误差 角度 出 发 , 主 成 分 估计 6* 比 工 .S 
估计 6@* 好 . 

关于 主 成 分 估计 的 其 他 - 和 些 最 优 性 的 讨论 见 131],[32]. 

刁 4.1 对 某 地 区 的 某 类 消费 品 的 销售 量 * 进行 调查 , 它 与 下 
面 四 个 变量 有 关 :， 2 居民 可 支配 收入 ，%% 该 类 消费 品 平均 价格 措 
数 ，z， 社会 该 消费 号 保 有 量 ，z。 其 他 消费 品 平 鬼 价格 指数 ,根据 
历史 资料 ( 见 表 4.1), 试 求 出 该 关 消费 品 的 需求 函数 关系 。 

《一 ) 计算 自 变 量 的 相关 系数 矩阵 中 (也 即将 原始 数据 2 首先 
中 心 化 。 得 到 2Z* 一 包 一 多. 1, 设 5 为 以 Z*2* 的 对 角 元 素 
为 对 角 元 素 的 对 角 阵 , 则 一 5-42Z*Z*5- 一 R。 类 似 于 主 


一 ] 


成 分 可 以 从 且 了 世 可 以 从 R 出 发 讨论 ， 本 例 我 们 从 R 出 发 进行 讨 
论 ). 
1.000 

D0.9804 1.000 

0.9883 0.9700 1.000 

O9877 站 99 人 1 O9695 1.000 


从 民 中 看 测 自 变量 之 问 存在 着 高度 相关 . 
丸 的 特征 报 分 别 为 
和 一 3.9436， 加 一 0.0400, 4, = 0.0126, 4 一 0.0036 
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表 4.1 某 类 消费 品 销 他 的 原始 数据 


和 2 3 和 5 在 7 六 9 1 

变量 
3 82-3 ; BBD | 99.9 1105.3 |117 ,7 131.0 [148.2 [I6t.8 [174.2 |184.7 
到 3 2 930 0960 | .人 IN 105.0 112.0 J172.0 p12.0 
二 17.1 | 21.3 | 231 | 29.0 | 34.0 | 40.0 44.0 | 493.0 | 51.0 | 53.0 
B40 | Of.0 | 97.0 | 97.0 JI00.0 101 .0 I10460 [109.0 111.0 I111.0 
T 号 .入 号 
EE 8.4| 9.4| 10.6 | 10.9 | 12.9 14.1 | 16.0 | 1a.2 | 19.51 19.6 


条 件数 。 一 /4 一 1095 > 1000, 说 明 自 变量 存在 严重 的 复 共 线 
性 ,其 中 第 一 个 主 成 分 的 贡献 率 2 / 也) 1 高 达 98.6 多 ， 故 我 们 


. 1 
只 须 取 第 一 个 主 成 分 即 可 , 往 应 于 2 的 特征 向 晤 为 
到 = CDOSOI6,0.4998,0.4980,.0.5007) 
主 成 分 变量 为 
gl ei 0.50162t 十 0.40998zr 十 0.498024 十 0.5007z7. 


C4.18) 
(此 处 z* 是 已 经 标准 化 的 》 


利用 (4.15) 芝 可 求 得 
Br RODD = 2.1512., 
这 里 由 于 内 取 一 个 主 成 分 , 故 玖 ”一 全 一 《394367 5 用 


a > xi— 14 
合计 m。 因 此 以 第 一 主 成 分 & 为 自 变 量 的 回归 方程 为 
= 14 十 2.15128， 
将 (4.18) 的 主 成 分 表达 式 代 人 上 式 , 并 将 z” 还原 成 原始 变量 z= 
Ca 4) ， 可 以 得 到 zx 与 -axazsa 的 主 成 分 回归 方程 为 
和 一 一 23.432] 十 0.02974, 十 0.1325%, 十 0.0826z, 十 0.1682z 
用 这 个 血 归 方程 对 原始 数据 进行 回报 ， 其 结果 填 在 表 4.1 中 的 最 
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习 题 九 
9.1 设 xx 一 (rss 一 0 其 中 


1 : 
nie (, 1) 

FN For 的 相关 系数 ,p>>0。 

1 试 水 出 = 一 《+,;*)” 的 两 个 主 成 分 . 

2) 指出 主 成 分 负 是 由 项 举 标 轴 旋 转 了 多 少 度 而 得 到 的 ， 

3) 捐 出 当 相 关系 数 2 为 多 大 时 ， 第 一 主 成 分 的 方差 贡献 率 才 能 达到 
9556 ， on 

9.2 将 上 题 推广 到 ?个 变量 的 等 相关 情况 ; 即 * 一 (x,>-…2r)” 的 相 
关系 数 矩 阵 为 


Pr 
= 有 li>p>t 


试 导 出 它 的 第 一 个 主 成 分 . 
9.3 设 x 一 《zzaszs7》 的 访 方 差 阵 为 
oY op 
z=iop or rp -LL <p<_l 
( 0 mp on ) Vi Yi 
试 求 主 成 分 及 每 个 主 成 分 的 亡 差 贡献 溺 . 

3.4 车 随 视 疝 量 * = 《#.9--…-，xp)” 的 协 方 若 妖 阵 是 2(Z>0)， 随 机 
向 量 > 一 《737 的 协 方差 矩阵 是 于 + 5， 其 中 >0 为 常数 , 了 
为 单位 阵 , 则 5'x 是 x 的 主 成 分 的 充分 必要 条 件 是 27? 是 y 的 主 成 分 ， 
其 中 工 为 正 交 阵 . 

9.5 设 对 于 标准 化 的 样本 数据 xjCi 一 1;.…s*#)。 其 衬 本 主 成 分 向 量 
为 了 一 (yo 其 中 = XG 一 1 的 396 为 样本 协 方 差 矩 阵 的 
第 i 个 大 的 特征 根 对 应 的 标准 化 特征 向 量 ; 求 证 

FF= 已 Fl 人 
=] 


其 中 or 一 Caoesypi 9 op pi 1 


+ {1244. 


9.6 根据 下 列 11 组 数据 ， 和 用 主 成 分 方法 建立 ? 与 rras 的 回归 
方程 ( 取 二 个 主 成 分 ). 


xi 《总 产 慎 ) < 【总 宵 费 ) .3 进口 都 


149 .3 108 ,1 15 9 
161 ,2 114.B 16.4 
171.5 123.2 19.0 
175.5 126.9 19.1 
180 ,8 132,1 18.8 
190.7 13 ,7 20.4 
202.1 146.0 22.7 
212 .4 1 上 26.5 
225.1 162,3 28 ,1 
231 .9 164,3 27.6 
239,0 167.€ 26.3 
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第 十 章 因子 分 析 
$10.1 概述 


本 世纪 初 由 Karl Pearson 和 Chales Spearman 关于 智力 的 
定义 和 测量 工作 而 开始 了 丙 子 分 析 的 近代 发 展 。 Spearman 对 学 
生 洗 试 所 得 的 分 数 做 了 分 析 ， 他 广 意 到 在 分 数 之 阔 的 相关 年 阵 中 
存在 一 定 的 系统 影响 , 表 1.1 是 茶 学 校 33 个 学 生 6 门 功课 的 相关 
系数 短 阵 

表 1.1 六 门 功课 的 相关 算 位 


. 1 2 .3 4 5 6 
1. 古 典 语 1 
2. 潜 语 0.83 1 
3 英语 ,78 .67 1 
4. 歼 学 0.70 0 .67 0.64 1 
5 判别 D0.66 0.65 D354 .54 】 
1 音乐 0 .63 .37 D.51 D351 | .4 1 


玫 中 课程 是 按照 相关 系数 从 上 到 下 递减 排列 的 。 Spearman -指出 ， 
如 果 第 ; 个 变量 (第 i 门 荔 课 ) 上 的 分 数 基 由 两 部 分 组 成 的 

ti aF+ eg; 《1.17 
那么 名 门 功课 相关 的 "效应 ”就 可 以 被 说 明 ， 其 中 F 是 对 所 有 变量 
都 起 作用 的 公 因 子 ，s: 是 对 x; 所 特有 的 ， 即 每 门 课 得 的 著 试 成 
绩 可 以 看 作 由 一 个 公 因 子 ( 与 智力 相 一 致 ?和 一 个 特殊 因子 之 和 组 
成 。(1.1) 式 是 最 早 的 最 简单 的 因子 模型 。 我 们 再 来 看 一 个 例子 ， 
考 总 人 的 五 个 生理 指标 : ”收缩 压 《xm， 舒 张 压 《sz)， 心 卡 癌 陋 
(x)， 呼 吸 间隔 Cx),， 舌 下 禄 度 《#22， 从 生理 学 的 知识 知道 这 五 
个 指标 是 受 植 物 神经 的 交感 神经 和 副 交 态 神经 这 两 个 因子 的 共同 
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影响 , 即 这 五 个 指称 译 少 受到 两 个 公共 因子 的 作用 ,如 果 用 Fl 下， 
分 别 琢 示 交 感 神 经 与 副交感 神经 ,那么 可 以 设想 变量 x 一 (xi …， 
x 是 下 一 《Fl,F,》 的 线性 郴 数 ( 即 F， 对 各 个 变 景 的 影响 是 
线性 的 ), 肯 加 上 其 它 对 x; 有 影响 的 因子 ,用 函数 的 形式 表达 , 即 
沽 . 


2 uP qnFst & | 
os > C1.2) 


Xs = dani onFy 十 gs 

或 者 写成 生 阵 形式 

x AF+-g 《1.37 
刘 果 Eis Rrs 5 还 可 以 分 解 出 一些 公共 因子 , 则 有 

| | g— MH+e 
此 时 
天 一 4 下 十 MH+ e— AMM ) +e 

因 嘴 总 可 以 认为 有 如 下 这 种 形式 

x— AF+€ C1.4) 


其 中 e 是 无 法 再 和 分解 出 公共 因子 的 特殊 因子 。 这 样 五 个 生理 变 
量 之 间 的 相关 “效应 "就 可 以 通过 公 因 子 和 特殊 因子 来 说 机， 

一 般 情 况 , 设 有 也 个 变量 一 《2 zs》 它们 受到 加 个 公 
因子 下 一 《FP,… ,FY 的 共同 影响 , 且 各 个 变量 还 单独 地 受到 
一 个 特殊 因子 ei(i 一 1,2,…,P) 的 作用 , 设 这 些 影 响 是 线性 的 ， 
即 可 表达 为 


2 uF 二 "二 mFnt £1 
i | Ga 
Xp 一 9iE1 十 -十 apm 有 ea 十 ee 
或 者 写 臣 和 矩 踪 形式 
x*— 4 下 十 在 C1.6) 


其 中 HT 一 1 2 一 1,2,--" ,#0.) 称 汶 第 1 个 变量 在 第 
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j 个 公 因 子 上 的 载荷 ，4 是 由 qii 为 元 素 组 成 的 矩阵 称 它 为 载荷 
淹 阵 。 同 样 地 ,了 个 变 便 之 闻 的 相关 关系 的 内 在 原因 ,就 是 这 通过 
: 公 因 子 及 特殊 因子 来 说 明 。 模型 C1.5)( 或 (1.6)) 是 针对 ?个 变量 
内 部 之 闻 的 家 关 关 系 ,因此 称 它 为 R 型 的 移 子 模 异 , 
当然 ,我 们 可 以 型 因子 分 析 看 为 主 成 分 分 析 的 一 种 推广 ,但 它 
与 主 成 分 分 析 是 未 同 的 , 主 成 分 分 析 丰 是 从 一 个 协 方 差 阵 (或 相关 
系数 阵 ) 出 发 直接 求 得 一 级 豆 不 相关 的 主 成 分 (它们 是 原 变 量 的 线 
性 组 合 ), 并 选 出 前 起 个 主 成 分 来 符 代 原 变 量 。 市 因子 分 析 则 蚌 驾 
用 假设 的 公国 子 来 “解释 ”相关 矩阵 的 内 部 的 依赖 结构 ， 它 们 的 数 
-学 表达 是 不 一 样 的 《比较 一 下 第 九 章 的 (2.1) 与 (1.5))， 在 以 后 的 
:讨论 中 读者 将 还 会 发 现 因子 分 析 与 主 成 分 分 析 的 其 它 不 同 之 处 . 
如 何 从 一 组 资料 出 发 ,分 析出 对 变量 有 公共 影响 的 公 因 子 ,在 
实际 工作 中 是 很 有 意义 的 ,例如 在 地 质 科学 中 ,可 以 利用 因子 分 析 
构成 在 各 种 地 质 作 用 下 和 化 学 元 素 的 自然 共生 组 合 或 其 它 地 质 因素 
的 自然 组 合 , 从 而 对 地 厦 , 地 球 化 学 现象 进行 成 因 分 析 ， 
在 第 八 章 聚 类 分 析 中 ,已 定 光 过 样品 之 河 的 相似 恬 的 度量 , 根 
据 前 面 认 述 呈 型 因子 分 入 的 思想 ,自然 想到 对 5 个 具有 某 种 程度 
相似 性 的 样品 ， 也 项 望 表示 成 一 些 对 各 个 样品 有 公共 影响 的 公 因 
子 和 对 各 个 样品 的 特殊 末 子 的 线性 组 侣 ， [mhbrie《1953)》 及 Be- 
nsecr《1972) 在 不 同 的 领域 中 首先 做 了 这 方面 的 工作 ( 见 [21]2. 
设 有 # 个 样品 和 …。 我 们 将 它们 麦 示 成 : 
si oF,t + nF tt 8 
-。.-.......-... 《1.73 
xz 一 Ba 
其 中 Pi 一 1.2 人) 是 对 每 个 样品 都 有 影响 的 公共 因子 ,而 
sdimm 1 9》 内 对 样品 xi 和 一 1,2, 2) 起 作用 的 特殊 
因子 .我 们 要 通过 公 因 子 和 和 将 琴 因 子 来 说 明 祥 品 之 间 相 似 关 系 的 
内 部 结构 , 《1.77) 这 种 因子 模型 称 为 8 型 因子 模型 ， 格 如 在 地 质 
学 中 ,有 一 沉积 盆地。 假设 有 三 个 弹性 区 供给 沉积 物 (如 图 1.1 所 
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未 )、 可 以 想象 ,沉积 盆地 中 的 任 一 个 样品 的 重 矿 物 的 百 分 含 量 者 
是 出 三 个 剥蚀 区 的 重 矿 

物 所 供给 及 各 个 样品 的 A 

特殊 因子 的 作用 而 得 到 PE x 


的 ， 因 此 沉 职 仇 地 的 任 。”/ 人 /一 
一 块 梯 品 <， 可 表 为 Nd ras 
F, 


x = gaF ot en 、 一 一 全 
+t osF,+ ei fC 
人 一 1 2) AAA 
和 型 因子 分 析 的 做 法 是 。 

在 沉积 盆地 中 末 集 许多 
禅 品 ， 利 用 样品 中 重 矿 
物 的 数据 ,去 找 出 公 因 子 F; 的 数目 及 甚 载 萄 【et}j， 并 赋予 Pi 
具体 解释 ,然后 找 出 它们 的 十 地 理 位 置 ,这样 我 们 就 可 恢复 当时 的 
古 地 理 面 貌 。 丙 亚 台 型 因子 分 析 在 实际 中 也 是 十 分 有 意义 的 . 

无 论 是 民 型 或 如 型 因子 分 析 都 是 用 少量 几 个 公共 因子 来 研究 

变量 (或 样品 ) 的 内 部 相关 (或 相似 ) 关 构 。 这 些 公 因 于 可 视 为 一 些 
随机 变量 , 且 事 先是 无 法 观察 的 ， 从 数学 上 来 看 ,因子 分 析 是 不 完 
善 的 ， 但 本 章 基 从 实际 工作 的 训 求 来 说 明 一 些 理论 上 的 赃 念 和 具 
体 的 方法 . - 


$ 10.2 正 交 因子 模型 及 其 解 


{一 ) 正 交 因 子 模型 

在 上 一 节 中 我 们 已 经 谈 到 因子 模型 分 为 丸 型 和 终 型 ， 本 节 以 
及 以 后 的 讨论 主要 是 针对 型 ,而 如 型 我 们 会 道 过 例子 来 说 明 。 

设 了 维 随 机 向 个 x* 一 (x,'…yxj) 的 均 信 向量 为 只 一 
Cms- pr》， 协 方差 阵 汶 了 ， 不 妨 将 x 中 心 化 ， 此 时 下 型 因子 
分 析 檬 型 可 写 为 


图 1.1 有 三 个 剿 包 区 的 沉 栈 盆地 示意 图 


x— rH—AFte (2.1 
" F489 。 


其 中 各 个 记号 的 解释 同上 节 , 注意 到 (2.12 中 用 了 了 十 严 个 不 可 观 
测 的 随机 变量 Fi, Fwel -sp 来 表示 了 个 变量 4- 27。 
这 正 是 RR 型 尖子 分 析 模 魂 与 回 映 神 弄 的 区 别 所 在 ,因此 对 于 (2.1) 
采用 回归 分 析 方 法 来 确定 载荷 牢 阵 有 4 是 行 不 通 的 ， 如 黑 我 们 对 FF 
及 8 作 一 些 候 定 , 那么 模型 (2.1) 就 具有 特定 的 昌 能 够 验证 的 协 方 
其 关 系 。 假 设 . 
ECF}Y— 0cov(F YT 1 
| ca 


Elg) = Dcowe) = po diagC di, -ph?) 
cov(s, FP) 0 | 
将 (C2. 站 及 (2.2) 合 在 一 起 称 为 正 交 因子 模型 (R 型 ), 当 所 的 各 
个 分 看 相关 时 ，covC 下 不 再 为 单位 阵 ， 其 相应 的 模型 称 为 疼 灾 
因子 宰 型 ,我 们 将 在 3 10.4 中 广 行 讨论 ， 
由 正 交 因子 模型 我 们 可 得 到 
Em co Cx) = EItxX OO— pCX OO— oY] 
~ E[CAF + eAF + ey ~ EIAFFA + EF A’ 
+ AFe + esl A4 寺 由 | C2.3) 
covCx FF) = Eltx — wl EI(AF -+ ee)F lI—A 
{2.4) 
由 (2.3)》 有 
oi Vartx) a a - 
fim 1,2,-*-,p (2.5) 
Ci ™ COVCxio XR) = nen Gel in | 
1 污 吉 (C2.6) 
由 《2.47 有 . 
CO 多 xi 关门 一 0 一 {2.7) 
夫 (2.5) 臣 可 以 看 出 变量 x; 的 方差 是 由 tw 个 公 因 子 和 特殊 因子 提 
供 的 . 称 o 为 第 i 个 公 因 子 对 变量 x; 的 方差 贡献 ,将 i 十 … 十 
di。 记 为 吕 ， 它 表示 了 绍 个 公 因 子 对 变量 wi 的 方差 贡献 总 和 ,并 
称 上 为 第 i 个 变量 的 共同 订 ， 它 刚好 是 载荷 短 阵 的 第 i 行 元 素 
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和 


平方 和 ,而 籽 为 特 玻 因 子 提 供 的 方差 称 为 特殊 度 ， 所 以 C2.5) 式 
可 写成 
vartri je on + ‘2.8) 
不 妨 设 zx; 已 标准 他 ,此 时 Yartx27 一 1 当 居 一 1 上 时， 同一 
0。 这 表明 zx， 能 被 所 有 公 因 子 的 线性 组 合 表 示 ; 当 局 接近 于 0 
时 ,表明 公 因 于 对 x*; 的 影响 不 大 ,此 时 x; 由 特殊 因子 来 描述 ,由 
此 可 泪 出 及 反映 了 变量 x; 对 公 因 子 依 赖 的 程度 。 另 一 方面 考 
典 基 个 指定 的 公 央 于 Fi 对 各 个 变量 x1,，**,x，。 的 影响 用 
. 时 一 时 十 轩 十 十 0 (2.9) 
来 描述 , 它 刚好 为 裁 荷 矩阵 第 7 询 的 元 圳 的 平方 和 。 称 gi 为 公 因 
子 Pi 对 所 有 ?个 变量 的 方差 贡献 。 显然 ,gi 越 大 反映 了 Fi 对 
所 有 变 最 的 影响 正大 , 它 可 作为 公 央 子 Fj 重要 性 的 一 个 度量 。 从 
(2.7) 可 看 出 ar 宕 示 了 变量 x; 与 公 因子 Pi 的 相关 系数 . 
从 上 面 的 讨论 ， 可 归纳 出 正 交 因 于 模型 中 的 载荷 和 矩 泗 4 有 如 
下 的 统计 者 义 : 
《iD 请 一 后 十 … 十 oj， 为 第 i 个 变量 的 共同 度 它 度量 了 
变量 x; 对 加 个 公 因 子 的 依赖 程度 ; 
2 为 第 7 个 公 因 子 Fi 对 所 有 变量 
的 贡献 , 它 作 为 公 因子 ;重要 福 的 一 个 度 景 ，。 . 
《3) a 是 变量 zx， 与 公 因 子 Ri 的 相关 系数 , 它 的 大 小 为 实 
际 工作 中 解释 公 因 于 的 实际 含义 提供 一 种 依据 . 
当 吉 > 1 时, 正 交 因 于 模型 术 身 具有 不 确定 性 , 即 载 荷 滤 阵 并 
不 唯一 。 设 了 为 mx 台阶 的 正 交 给 阵 , C2.1) 式 可 改写 为 
x pa AF-e— ATTF-e™ AtF*+e (2.10) 
其 中 A* 一 4T,F* 一 7T’F, 晶 有 
ECF*)~ TECF)=—0 
coveF Y= Teo FITT TT 1 
cov(e,F* ~ cov(s, TF)— Fle*r FT 0 
于 是 4* 和 此 ”也 满足 模型 ， 显 然 信 变量 %,-…',xp 的 观测 信 ， 
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我 们 是 不 可 能 区 分 载荷 阵 4 和 A4*, 即 公 因 子 和 一 TF 
其 有 相同 的 统计 性 质 ,载荷 垂 阵 4* 和 4 虽然 不 同 , 但 它们 可 产生 
胡同 的 协 方差 矩阵 互 ， 即 

了 一 44 十 由 一 Ai 十 四 (2.11Y 
虫 于 FY 一 了 FF， 说 明 FF* 是 由 六 经 过 正 交 旋转 得 到 ， 同 样 
有 4" 于 AT 也 说 明 A* 是 由 4 经 过 正 交 变换 而 得 到 ， 从 而 可 推出 
对 于 下 和 天 *， 变 最 * 的 共同 度 向 是 一 样 , 即 


- 达 ie > 

或 者 说 共 辣 庶 大 与 正 交 阵 开 的 选择 无 区。 关于 这 种 不 确定 性 在 
实际 应 用 中 十 分 重要 ,我 们 将 在 下 一 节 看 到 这 一 点 ， 

(二 ) 国 子 载 荷 阵 的 估计 

由 因子 楼 型 知道 ， 我 们 试图 用 mm 个 公共 因子 和 特殊 欠 子 来 研 
究 相 关 垂 阵 的 内 部 依赖 结构 或 者 说 相关 关系 的 内 在 原因 。 有 从 本 质 
上 讲 就 是 要 建立 统计 模型 (2.1) 与 (2.2), 使 其 满足 方差 结构 (2.3)， 
即 


ZE™= AA 和 + 

我 们 知道 协 方 莹 阵 呈 的 估计 为 样本 协 方差 阵 5， 如 果 5 的 非 
对 和 拥 线 元 素 都 较 小 , 即 它们 与 无 蝇 著 差异 ,那么 上 个 变量 基 瑟 不 
相关 的 ,此 时 特殊 因子 起 着 决定 性 作用 ,因此 在 这 种 情 钢 ， 作 因子 
分 析 是 无 前 义 的 ,如 果 3 不 是 接近 对 角 阵 ,那么 可 以 考 潜 建立 因子 
模型 。 队 理论 上 加 何 去 检 验 了 县 有 结构 (2. 3) 的 网 题 ， 我 们 将 在 下 
一 段 进行 讨论 . 

如 果 涛 虑 建立 因子 模型 ， 第 一 个 要 解决 的 问题 是 如 何 估 计 载 
敬 和 矩阵 4 及 特殊 方 着 四 :Ci 一 1,2,…',P). 上 是 前 已 提出 了 许多 方 
污 , 如 极 大 候 然 法 , 主 成 分 法 以 及 主因 子 解 等 方法 。 在 这 里 我 们 公 
介绍 极 大 似 然 共和 主 成 分 法 。 

1” 棚 大 似 然 法 . 

定理 2.1 设 zx 《ab 是 从 正 态 总 体 Nitp;2》， 


“33， 


《3 > 0) 质 取 的 容量 为 = 的 样本 ， 其 中 志方 莽 阵 开县 有 结构 : 
BemAAd 十 ,这 里 的 有 4 是 PX 再 阶 算 际 ,， rkKA 一 坑 ， 由 一 
diagtpi) ,由 2)， 则 4 和 由 的 极 大 似 然 估计 满足 力 程 组 : 
人 2 一 diagk-dd 十 46) C2.12) 
A SCAA + bY!A (2.13) 
其 中 
一 十 3 一 YC 一 下 了 ， = 一 工 习 sr 


1 


* 证 明 ”由 于 了 一 44 十 由。 此 时 似 然 函数 为 

Lp A 一 (2z) 二 144d + |. 
erp{—L [CA4 + bns + nz — pAXE— 7)]) 
从 而 


In KR 好 ,由 ) 一 一 加 lnC2x) 一 节 in jd 十 出 | 
一 {CAA’ + bY)!Lns 


+ mE pCE CO— pp)]} 

利用 第 一 章 第 四 节 中 有 关 奸 阵 的 微分 公式 : 

{i) dln |X| = trX dX 

(ii) dX XT dX XT 

tt of 

[i uy dd 

Civ) d(x Ax) — 2(AxY dx 

Cv) HLAdXX)I = ul2C AXYAX] 
上 述 五 个 公式 中 4 表示 对 称 矩 阵 。x 表示 向 量 , 蔷 表 示 和 矩阵 。 此 
外 ,还 注意 到 trCAB) 一 tr(BA) 一 tr(4B), 从 而 有 


* F313» 


dinL(p,A,b) 一 一 trCAA4 + yadaAd + dg) 


+ tn — gCAA + bap 
十 这 tr{CAA t+ PIHAAA TAB NCAA + oY 
[ns + (2 — pXE— py]} 
为 了 简洁 和 方便 ， 记 j= nLCpA.4),3 一 AA 十 ,WW 一 9 


十 aC 芝 一 此外 下 一 上 》， 经 整理 后 得 
df 一 oe — gp) dp trlns lA py 3- 1.4] 2 


一 六 trln2 tT— ZWZ2 dy 


令 于 关于 晴 . 由 ,4 的 导数 为 0, 再 注意 到 4 一 diagKdyi 
4 中》， 有 


(i) 产 一 元 

《ii diag[f 4 4 YT CAA + PIISCAA + bp) 1] 一 0 
{2.14) 

Ci) CAA STA CAA bY SAA + pI A 0 
(2,15) 


由 (2.15) 得 到 
CAA + HII SCAA + $I]A=0 
从 而 有 
4 一 4 十 看 ) A 
这 就 得 到 了 了 (2137 式 。 为 了 化 简 (2.14) 式 ,注意 到 (2.14) 等 价 于 
diag{ gCAA4 + BIAT — SCAA' 十 的 -时 一 0 (2.16) 
咎 C(2.13) 式 知 AA 一 SCAA 十 出 ) 4 从 而 4 一 3 一 4 ,所 以 有 
SAA 十 由 六 用 一 人 一 好 4 一 4 十 男生 (2.17) 
也 于 
CAA + EI SAA + hy 
— pAA TT pI pAAd + hs — AAY 
* 34+ 


一 本 4 十 出 亲 二 一 人 一 4 十 4 十 由 4 
一 四 十 4 一 人 
于 是 得 到 
diags 一 diaggf op 十 AA'Y) 
这 便 蚌 (2.12) 式 ,从而 定理 得 证 ， 胃 
田 上 上 一段 的 讨论 知道 朝 荷 和 阵 4 是 不 唯一 , 汶 此 有 人 建议 
[261 袜 加 一 个 计算 一 方便 的 唯一 性 条 性 : 
由 br 一 (2.18) 
上 上 式 中 的 4 是 一 个 对 和 角 百 。 
方程 组 《2.127 必 2.137， 再 其 上 唯一 性 条 件 (2.185 一 般 只 能 用 
- 渤 代 忒 来 求解 。 但 这 种 迭代 法 是 否 收 和 伍 并 不 知道 直到 1967 年 
Jireskog 等 人 提 田 一 个 较为 实用 的 计算 方 活 。 极 大 飞 然 法 才 被 人 
们 所 采用 。 下 再 我 们 简单 的 介绍 Jreskog 提出 的 方法 ， 
定理 2.2 设 ,XX 为 正 态 总 体 WE ED TS 六 0) 的 
样本 (Cn > p).3 具有 结构 : 3 一 44 十 ， 且 44 和 消 满 足 唯一 
性 条 件 (2.187, 则 4 与 由 的 衫 大 人 羽 热 估计 满足 
Chg mA Cp SIAN 4) (2.19) 


po diagt S$ — AA') (2.20) 
县 
redA + Sp {2.21Y 
上 述 定理 的 证 明 类 似 于 定理 2.1, 在 [261 给 出 了 详细 的 证 明 。 
此 定理 及 其 证 明 中 ,读者 要 注意 到 : 


C1) (2.19) 式 表明 6-34 的 第 1 列 是 午 阵 $1548 于 对 应 于 
转 征 柜 1 十 小 的 特征 向 最 (不 是 单位 化 ), 其 中 
S 一 之 BY Cx 一 二 Kx — BY, 


且 4 学 妨 > … 4 为 4 的 对 角 元 素 ， 
(2) 在 定理 的 证 明 中 , 先 把 极 大 似 然 估计 六 一 交代 人 似 然 函 
数 ,并 对 似 然 函数 取 对 数 ,路 去 与 4 和 少 无 关 的 常数 项 ， 问 题 归结 


人 


为 ,在 唯一 柱 条 件 ，A' 册 "4 一 4 (为 对 角 阵 ) 之 下 , 求 
了 和 让 ,4 四 一 In| 瑟 | 一 ii13 + tr 一 如 (2.22) 
的 最 小 值 . 
迁 代 步骤 为 : 
Ci》 计算 特殊 方差 的 初始 估计 ，Jsreskog 建议 取 


到 一 人 一 二 全 (起 C223) 


其 中 上 为 1! 的 第 i 个 对 角 元 喜 
《ii 对 于 给 定 的 站 一 diagC$ ,中 ,) 计算 
Gh 一 旋 人 太 人 《2-.247 
的 前 普 个 特征 最 和 > 多 > … > 和 > 1， 及 相对 应 的 单位 化 转 
征 向 景 站 ，&, 记 应, 一 diag( 和 和 一 [Be]， 
由 [2.19) 有 记 一 1 十 了 了， 让 一 让 4 六 #， 从 而 得 到 4 的 估计 
了 一 时 8 一 于 页 三 — 1)+ (2.25Y 
《iiy 将 (ii》 中 得 到 的 学 代 人 目标 函数 (2.22) 式 , 关于 
,中 ,使 其 极 小 化 ,得 到 特殊 方差 的 新 估计 ,将 此 新 估计 代 
A 24)， 重 复 步 绝 (i) 和 (iii)， 直到 相信 两 次 迁 代 产生 的 四 
和 全 无 明显 差异 为 正 。 
2°? 主 成 分 法 
前 面 已 谈 到 ， 我 们 建 并 的 因子 模型 使 其 满 是 方差 结构 ; 3 一 
44 十 四。 设 了 的 特征 根 为 4, > 加 兰 .…。 1,， 相 应 的 特征 - 
向 量 组 成 的 特征 疝 量 矩阵 为 王 一 [e,-….er]， 记 DD 一 
diagkjy 7)》， 有 此 时 有 
EZ- PDP’ 一 和 eei bee 十 ”十 1ere5 


We 


_ 一 vites| 
[a © AD 2 Vas ep] 一 dd C2.26) 


We 
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《2.26) 式 的 分 解 正 是 公 因子 与 变革 个 数 一 样 ， 特 殊 因 子 的 方差 为 
0 的 周子 模型 的 方差 结构 形式 , 即 
FE Ad + O= AA (C2.27) 
因子 分 析 就 是 村 寻找 少数 几 个 公 因 子 来 解释 变量 的 相关 结 
构 ， 因 此 (2.27) 的 结构 形式 在 实际 应 用 .上 是 无 价值 和 的。 类 似 于 主 
成 分 的 思想 , 如果 对 的 最 后 了 一 世 个 特征 根 很 小 时 , 在 C2.26) 式 将 
4wtieshiesti 十 '… 十 ipepe， 了 略 去 ,这 祥 我 们 就 得 到 
Ve 
IVae, 
了 [vie Ve Visel | . |~4A4 


Fa 
{2.28Y 


这 里 的 之 是 了 Xx 轴 阶 ， (2.28) 式 近似 表明 了 因子 模型 ，(2.1) 中 
的 特殊 因子 是 不 童 要 的 ;能 从 Zz 的 分 解 中 忽 陪 掉 ,如 果 要 考虑 特殊 
因子 ,那么 我 们 可 以 用 diag(3 一 了 44') 来 估计 由 一 diag( pi,"， 
由 )， 这 里 的 肚 是 由 (2.28) 所 定义 ， 此 时 近似 关系 为 
EAA diag( 5 — A4) 
Ve 
一 [We …， Vlmes] : 二 由 (2.29) 
V Lne” 


其 中 由 一 diagt 四， 中 一 0il 一 > a ti 1,2,*, 
了 中 了 


p)。 因此 载荷 内 阵 4 的 估计 为 4 一 (VL eV lnen). 
在 实际 问 镍 中 5 是 未 知 的 ,必须 用 它 的 样本 协 方差 来 代 符 ,但 

天 诸 变 量 的 量 纲 不 同 ,往往 将 数据 标准 化 ,利用 标准 化 数据 计算 出 

来 的 样本 协 方 鳌 便 是 原 数 据 的 相关 系 煞 和 失 阵 R， 这样 我 们 将 .上 述 


+ 437 * 


的 方法 用 于 号 ， 可 得 到 类 似 于 (2.29) 的 烙 示 : 
RR ~ AA'+h (Vi 人 
Viea| /. ， 
wise | : |+ “ (2.30) 
2 0 " 
WA 二 入 四 
其 中 i 汪 思 实 ” “is 1 分 别 是 的 前 ww 个 较 大 特 
征 很 与 相应 的 单位 化 正 灾 特征 向 是 ， 特殊 方 着 内 用 iag(R 一 
可 全) 来 居 计 。 因 此 ,由 民 出 发 因子 分 析 模 型 的 裁 敬 矩阵 的 估计 为 


和 一 Vi en Vo,) (2.31) 
特殊 天子 的 方差 四 一 1,2,-……,P》 的 信 计 为 。 
归 一 1 一 3 和 《2.323 


其 中 5 为 如 的 (i,j) 元 素 ， 
共同 度 点 的 估计 为 


一 让 CG 1,2,.-*,p) (2.33) i 


ma 


公 因 子 Pi 对 各 变量 的 “贡献 ”g} 的 估计 为 
庄 二 本 5， (一 上 2: 《2.34 


公 因 子 数 * 的 确定 仍 按 主 成 分 的 思想 来 定 ， 比 较 理想 的 情况 
是 只 有 少数 几 个 公 因 子 对 变量 的 “贡献 "很 大 ， 和 注意 到 在 标准 化 变 
量 的 情况 下 ， 所 有 变量 的 总 方 着 为 trCR) 一 上 ， 第 i 个 公 因子 F; 
的 “贡献 "为 


8 SCV Ve) ~ C2.35) 


因而 寻找 一 个 血 使 得 
P 438 + 


{3 2/ 站 100% 之 80% {或 75%%) C2.36) 


就 确定 该 几 为 公 因 子 数 ， 

在 上 一 节 中 我 们 提 到 & 型 的 内 子 模型 (1.7), 它 是 将 样品 表示 
成 公 因 子 和 特殊 因子 的 线性 组 合 ， 通 过 少数 几 个 公 因 子 来 研究 样 
品 祖 似 性 的 内 左 联 系 ，Imbrie [21] 提 出 了 用 样品 的 相似 系数 矩阵 
进行 8 型 因子 分 析 。 样品 的 相似 系数 短 阵 为 


QO— (cosh,i) x (2.37) 
其 中 
了 >， Ta 
cosO,s 四 一 人 -一 一 一 (2.38) 
Px’, 。 之 | 


表示 样品 x; 与 x 的 夹 角 余 驴 。 . 
类 似 于 民 型 分 析 , 求 日 的 特征 祖 元 闻名 守 … 守 和 及 相应 
的 单位 化 正 交 特征 向 量 音 ,&,…… ,部 、 选 择 坎 使 得 
(D/A to0% > 0% (R75%), 


这 个 所 做 为 公 因子 的 数目 ， 这 样 便 可 得 到 吕 型 因子 分 析 的 载荷 矩 
阵 的 估计 为 


ECV, VE) (2.39) 
无 论 是 玉 型 或 8 型 因子 分 析 , 我 们 要 对 公 因 子 给 予 具体 解释 时 ,部 
必须 通过 载荷 阵 找 出 各 公 因 子 的 “代表 "变量 或 “代表 "样品 ， 通 过 
“代表 ”变量 或 “代表 "样品 的 特征 给 予 公 因 子 具体 解释 或 赋予 公 因 
子 其 体 含义 。 
(三 》 协 方 次 矩阵 结构 的 检验 
我 们 建立 的 因子 分 析 模 型 , 使 其 满足 协 方差 阵 具 有 结构 一 
44 十 由 ,这 里 4 是 户 X 玉 阶 抢 阵 。 袁 个 变量 的 协 方 差 阵 是 否 存 
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碍 这 样 的 结构 呢 ? 或 者 说 ， 因 子 模型 是 否 适 用 ? 这 就 需要 检验 候 
设 。 

月: 工 一 4 十 出 Hi: 不 取 -44 十 而 的 形式 . 《2.40》 
我 们 就 正 态 总 体 来 讨论 此 问题 ， 

定理 2.3 设 i 是 正 森 总 体 NAR:2), CE > 0) 的 
样本 (sn > p)。 检验 假 设 C2.40) 的 检验 但 然 比 统计 量 为 


ie 一 sl (2.41) 
| 相公 + 


其 中 $ 一 过 D7 x, — Ex; — £), 元 一 了 xx. 和 和 起 是 
1m d=1 


4 和 中 的 极 大 似 然 估计 , 即 4 和 生 是 方程 (2.12),C2.13) 的 解 . 
此 定理 的 证 明 是 利用 大 家 熟知 的 似 然 比方 法 便 可 完成 . 


(2.41) 的 等 价 统 计量 为 
2 |SI1|A44 + $i (C2.42) 
有 关 4 的 新 近 分 布 是 有 如 下 结论 ， 
定理 4 当 #->co 时 
i _2p+11 2 
|， + m|in2 xz 有 (2.43) 


其 中 ff 一 广 [Cp 一 mm》 一 Cp 二 J. 


应 用 上 面 的 答 验 时 ,必须 先 求 出 极 大 似 然 估计 子 和 上， 这 须 
要 用 计算 机 有 关 程 序 进行 选 代 计算 ， 在 进行 计算 时 仍然 涉及 到 事 
先 要 取 多 少 个 公 因 子 ， 即 mw 应 取 多 大 的 问题 。 有 的 人 是 经 验 地 定 
一 个 m。 有 的 人 是 利用 主 成 分 方法 计算 相关 矩阵 的 特征 根 , 由 前 
缮 个 特征 根 在 所 有 特征 根 中 所 占 的 比例 来 确定 关 , 有 的 人 到 大 于 1 
的 特征 根 的 个 数 定 为 wm。 一旦 mm 确定 了 ， 就 计算 辽 和 各， 然后 
进行 检验 假设 52.40), 如 时 接受 刀 ， 说 明 烧 型 适用 ,如 果 拒 绝 五 ,， 
那么 再 增加 一 个 公关 子 , 即 加 十 1 个 公 因 子 ,再 作 以 上 的 估计 和 检 


二 #40 时 


验 , 由 于 固 寺 乡 的 ,总 可 以 找到 一 个 适当 的 公 因 子 数 自 ， 使 得 相应 
的 因子 模型 适用 。 当 然 ,在 许多 应 用 实例 中 ,人 们 往往 直接 利用 主 
成 分 法 定 出 m， 而 不 再 去 作 检验 。 

《四 ) 实例 

下 面 的 两 个 实例 都 是 利用 主 成 分 估计 方法 进行 因子 分 析 . 

例 2.1 在 基 市 高 其 的 理科 考生 中 ， 抽 取 了 90 名 考生 的 成 绩 
作 丸 型 因子 分 析 , 变量 为 七 门 考 试 科目, 利用 计算 机 得 到 这 七 站 科 
目的 相关 系数 完 阵 ( 表 2.1), 计 算 想 关系 数 矩 降 的 特征 根 及 相应 的 
单位 北 特 征 向 量 列 在 表 2.2. 


表 2.1 七 门 考试 科 上 且 的 相关 系数 短 阵 


从 表 2.2 可 以 看 出 前 三 个 特征 报 的 累积 百分比 为 75.1 免 , 所 以 提 
取 三 个 公 因 子 , 利 用 (231) 一 (234) 可 分 别 计 算出 因子 载荷 阵 ， 特 
区 因子 方差 \ 检 同 麻 及 公 因 子 方差 贡献 ， 并 列 于 表 2.3， 

家 2.3 公 因 子 载荷 阵 , 共 辣 度 .特殊 因子 方 楚 及 公 因 子 方 浆 页 献 


F, F, 
变量 ~ 
FI 焉 请 0.62 —0.44 
rt: 语文 0.69 0.20 
x3; 数学 人 0.64 be 
;物理 0.71 0.35 
xs 化 学 0x5 0.3] 
xs: 外 语 0.69 —0.41 
*y; 些 物 0.84 —0.20 
从 因 于 贡献 3-5T 1.03 
贡献 味 积 50,1 器 64.96 


由 于 载荷 oj; 表示 了 第 i 个 变量 与 第 i 个 公 因 于 的 相关 系 
数 , 因 此 我 们 可 以 根据 各 个 公国 子 上 的 载荷 对 公 因 子 赋予 解释 . 先 
看 公 因 子 _ Ri， 所 有 七 个 变量 在 它 上 面 都 有 相差 不 太 大 的 正 载荷 ， 
这 个 公 因 子 可 赋予 它 为 中 学 生 的 “一 般 智 力 ” 困 子 ， 公 因子 F, 与 
F, 其 载荷 有 正 有 负 , 斩 不 好 解释 。 留 到 下 -- 节 的 正 交 旋 转 后 再 来 
作 较 为 详细 的 解释 。 

例 2.2 伪 品 部 门 为 了 掌握 男 . 女 各 年 龄 组 的 人 对 各 种 食品 的 
喜爱 情况 ， 调 查 了 男 、 女 十 个 不同 年 龄 组 的 人 对 100 种 食物 (包括 
主食 ,面条 ,面包 : 肉 类 , 鱼 关 、 蛋 类 及 各 种 蔬菜 等 ) 的 喜欢 食用 程度 
的 数据 ， 数 据 采 用 打分 形式 ,10 分 为 满分 ， 然 后 对 其 进行 因子 分 
析 。 变 量 为 x, 一 男 16 岁 以 下， 坟 一 男 16~~20 岁 ，% 一 男 21~ 
旨 央 ， 一 轨 31 一 相当 ， 有 一 曙 41 岁 以 上 ; 一 女 16 鹤 以 
下 中 女 16 一 20 因 ，g 二 女 21~0 究 ,二 女 31~ 折 发 ， 
zi 一 妇 41 岁 以 上 ， 每 个 年 龄 组 调查 了 3 一 120 人 不 等 ， 然 后 再 


* 和 2， 


x 


z116°0 | TO | SIy90 | YE6 0 | Ger5°0 
T | grsg0 | gu9e°0 | srt’o | TO 
I G58" Soke 0 sers’t 
1 | 8389'°0 | gpse’o 
1 | i202°0 
1 
i 1 加 入 5 | 


12E9°0 FBS nesp"0 576°0 Wid 
TL0 | ero2’0 | F005*0 
G619°0 | og69°0 | 9604°0 | 9019°0 和 
gagr'0 | y85970 182°0 | 201870 
08SE 站 | TO | LOT8’d | tose’o "x 
Zh z924°0 120+"0 T2321°0 x 
T | pesg0 | zhog’oD T1045ED ' 
I 88S 0 | B515°O i 
| 

F 80 EE 
, 

ey iy Ex 人 


刺 时 疾 淮 尖 肚 邹 兴 入 轨 装 醇 多 地 小 二 '? 闭 
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家 2.5 林 ”同年 龊 组 的 久子 载 桂 、 特 殊 因 子 方 整 , 划 同 度 及 公 因 子 方 冰 贡献 


一 和 .5743 


0. D0955 
.3604 | 一 个 ,3093 0 .08 
.8319 D2064 0.0759 
0 .7794 .4706 DD.06518 
.740 .455 D117l 
0 一 让 .534 人 0 D0619 
O8970 | —0.328B D.0670 
心 .89 才 了 一 心 037% O14965 
.93 v.216% D0764 
站- 0.3571 D0470 


1.762 


mn 
Dd 
1 


3.9096 


取 平 均 。 从 所 调查 的 数据 ， 计 算得 十 个 年 抢 组 的 相关 系数 矩阵 如 
表 23.4 所 示 。 从 相关 系数 抑 阵 中 可 看 出 同年 龄 组 的 男女 之 间 碍 关 
系数 比较 大 ,特别 是 男女 少年 《16 岁 以 下 ?相关 系数 高 达 小 9383。 
诈 算 相关 甜 阵 的 特征 根 为 6.828 ,1.762,0.754,0.2620.122， 
0.098,0.072,0.044,0.036, 0.022.。 头 三 个 特征 根 的 累积 百分比 已 
达 93.44 免 , 因此 我 们 取 三 个 公 因 子 , 前 三 个 特征 根 对 应 的 单位 化 
特征 商量 为 
名 一 【0.2841 .0.3293，0.3183,，0.2985 ,0.2579,0.3081 ， 
0.3433,0,3424, 0,3442,0,3033Y 
在 一 《一 0.4357 ,一 0.2351 0.1571 0.3582 ,0.4913 ， 
—0.4065, —0.2503, —0.0288,0.1650,0.2718) 
矶 一 《 一 0.1771 ,一 四 3158 ,一 0.5014， 一 0.3794， 一 0.1259， 
0.0838 ,0.1639 ,0.2407 ,0.2999,0.5115Y 
银 据 (2.31)~《2.34) 可 分 别 计算 因子 载荷 降 , 特 殊 因 子 方差 、 共 同 
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度 及 各 公 因 子 方差 下 献 ,并 列 于 表 2.5. 

公 因 子 ,5,， 男 . 女 十 个 年 龄 组 在 亡 上 面 的 裁 荷 都 为 正 且 在 
0.8 左右 ， 所 反映 的 是 不 分 人 性别 和 年 龄 的 共同 嗜好 程度 ; 公 因 子 
P:， 在 同一 性 别 的 年 龄 组 之 间 载 荷 有 正 负 之 异 ， 它 反映 局 一 性 别 
不 同年 龄 组 之 间 存 在 不 同 嗜好 ; 公 因 子 了 ,。 男 性 载荷 为 负 ，、 女 性 
载荷 为 正 ， 反 了 映 了 男 与 女 之 间 的 不 同 嗜好 。 对 于 这 三 个 公 因 子 重 
精确 的 解释 将 究 到 正 交 旋转 以 后 再 来 讨论 . 

(五 因子 模型 的 几何 解释 

为 了 便于 理解 ,我 们 对 因子 模型 作 一 点 几何 解释 ， 

在 因子 分 析 中 ， 我 们 可 以 把 互 不 相关 的 ， 邑 两 两 之 间 的 祖 关 
系数 ( 夹 角 余 弦 ) 汶 零 ， 各 自 方差 为 1 的 m 个 公 因 子 和 了 个 特殊 因 
子 当成 加 十 了 个 相互 下 直 的 单位 向 量 ， 以 它们 为 学 标 轴 构 成 但 十 
维 空间 的 一 个 直角 坐标 系 。 并 称 为 因子 空间 。 于 是 变量 x 可 
以 几 向 量 Pi 一 (enemy ye 0 04is0 -07 表示 ,其 中 
由! 是 为 在 对 应 于 自己 的 特殊 因子 轴 上 的 载荷 。 由 于 x 标准 
化 ,显然 p; 的 长 度 为 

pi 让 一 Ce 十 三 十 十 o 十 好 六 一 Vvarzy 一 1 
此 时 pi 与 委 个 因子 轴 F; 的 夹 角 余弦 为 

cos (Pi Pi) = pillcos PF) — oy 一 rn 
”这 表明 了 户 与 各 公 因 子 的 夹 第 余弦 就 等 于 其 对 应 的 坐标 。 也 就 
是 等 于 变量 x; 与 各 公 因子 的 相关 系数 。 此 外 ,对 于 x; 和 性 所 
对 应 的 向 量 p; 与 p; 的 来 角 余 弦 为 


cos (Pipi) 一 到 了 一 Pipi™ 人 076 — 六 
它 检 好 等 于 变量 x; 与 x; 的 相关 系数 。 
$ 10.3 ”因子 正 交 旋 转 


《一 ) 方 束 板 大 旋转 
在 上 区 (一 ) 段 中 已 经 指出 满足 方差 结构 名 一 44 十 由 的 因 
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子 模型 中 的 公 内 子 与 载 苟 矩阵 并 不 叭 一。 若 A 满足 立 一 44 二 
力 ， 那 么 对 于 X 如 阶 正 交 矩阵 了 ， 则 Fr* 一 了 下 出 是 公 因 于 ， 
柱 应 的 载荷 矩阵 为 A* 一 4T, 它们 也 满足 .FF 述 方差 结构 形式 , 而 
A* 一 AT 表明 新 的 载荷 阵 4* 是 将 4 经 过 一 个 正 交 旋转 而 得 到 ， 
而 这 种 旋转 对 共同 度 是 不 变 的 ， 从 而 对 特殊 因子 方差 也 不 变 。 为 
了 方便 叙述 我 们 把 4 称 为 初始 载荷 矩 阵 。 在 实际 应 用 中 要 对 公 因 
千 P; 进行 解释 ,因此 希望 各 个 变量 在 该 因子 上 的 载 敬 ay(i 一 1， 
2,-…:p) 两 极 分 化 , 即 只 有 少数 变量 在 Pi 上 有 绞 大 的 载荷 ， 和 而 
其 余 变 量 的 栽 敬 尽 可 能 的 小 ,这样 Pi 的 具体 含义 可 由 载荷 较 天 
的 变 景 根据 具体 问题 加 以 解 其 。 若 载荷 矩阵 的 每 一 列 都 具有 两 极 
分 化 的 特征 , 称 这 种 载荷 阵 具 有 简单 结构 。 由 以 上 所 述 。 我 们 要 通 
过 正 交 旋转 寻找 一 个 简单 结构 的 载荷 短 阵 。 在 这 里 我 们 介绍 一 种 
方差 极 大 症 转 。 

方差 极 大 旋转 是 使 载荷 阵 的 每 一 询 元 素平 方 的 方差 达到 景 大 
作为 载荷 阵 简单 结 构 的 准则 。 对 于 公 因 了 Fj(j 一 12,.…… ,sm), 户 
个 变量 在 它 上 面 的 载 背 慎 平 方 的 方 莹 为 


Vi > (一 克 一 [p(y 一 (Sa)]/e 
其 中 6 表示 经 过 正 交 旋转 后 所 得 因子 载荷 矩阵 的 元 索 ， 于 一 


二 总 的 。 对 于 所 有 六 个 公 因子 载荷 信 平 方 的 总 方差 为 
(| 


Vv* 一 3 y; ~ >[: Gy ~ (> B)|/r G3.) 


次 转 后 的 载荷 年 阵 的 元 素 就 是 要 使 得 (3.1) 式 还 到 最 大 . 考虑 到 各 
| 变量 共同 诬 Bi 呈 T 2 py 的 差异 的 不 平衡 ， 我 们 用 bi 
代替 (3.1) 式 中 的 站 ， 从 而 得 到 


p > C53/BY 一 (> CaD) | /fp 32) 


y | 


Fei 
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这 样 旋转 的 准则 就 是 全 得 (3.2 达到 最 大 。 现在 的 问题 就 归结 为 
村 找 一 个 语 X 好 阶 的 正 交 抵 阵 宇和 剑 得 B 一 4T 生 使 (3.2) 达 到 盟 
大 ，m 维 坐 标 系 的 正 交 族 转 可 以 由 所 有 的 黄岗 公 因 子 轴 构成 的 平 
画 正 交 旋 转 一 个 角度 来 完成 ,一 共有 Cs 个 因子 轴 组 成 的 平面 ,每 
次 的 转角 9 都 必须 使 达到 最 大 ， 

对 任意 的 两 个 因子 轴 Fi 及 PKg 一 12 一 1 8 << 
9 所 构成 的 因子 平面 正 交 旋转 一 个 角度 pe 变量 wi 一 1， 
2 在 下 和 下 轴 上 的 初始 载荷 为 (ai 46014)， 经 流转 启 
的 截 荷 为 《540,60) ,i 一 1,2,--…p)， 两 再 之 闻 的 关系 为 


bs Bs 1 Ge . 

Ys Bay | 424 Ce Pre sin pee) 
: : : sin pp cosqprs 
Bar bps pp dpg 


上 面 只 吉明 旋转 F，, 与 F， 攻 得 到 mt 一 1,2,-*-,p) 在 两 个 新 
公 因 子 轼 上 的 载荷 5 和 50。 此 时 xisCi 一 1,2,*"*,p) 在 其 
它 公 因子 四 上 的 载荷 并 没有 改变 ,因此 , 当 FF， 与 Fs 轴 旋 转 后 得 
到 的 载 共 矩阵 应 写成 
FB- A:.7,, (3.3) 
其 中 二 为 将 4 中 的 8 9 两 列 元 素 改 为 (5 和 
《5 ， 其 余 元 素 不 变 , 邵 
Bis 一 qecos Pre 十 aiysin prs 
big 一 一 本 sin prs 十 gig cos Deg C3.4) 
bi dam 1 gs0, 
fe 112 pp. 
而 Tj 为 徊 多 澡 阶 矩 阵 ， 它 的 第 8 行 第 8 询 的 元 案 为 cos er， 
第 8 行 第 8 列 的 元 宕 为 一 sm gps 第 48 行 第 8 列 的 元 索 为 
sin rr， 第 4 行 第 4 列 的 元 素 为 cossr， 除 此 之 外 的 其 它 元 
素 对 和 角 线 为 1, 非 对 角 线 为 0。 
我 们 必须 对 所 有 的 公 因 子 轴 配 对 旋转 ,总 共 要 旋转 Ch 次 , 即 
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得 到 
Boy AT * Ta -Tn | Ty Tm 


Town 


一 二 1l 下 Ts 一 40: (3,5) 


R= 如 王 吕 直下 


其 中 Ci- 用 末了, 由 于 正 交 阵 的 很 积 仍 为 正 交 阵 , 故 C， 


= + 


为 一 个 二 久 喇叭 正 交 阵 。Ba, 为 第 一 个 循环 完成 后 的 载 区 矩阵 ， 
例如 , 设 有 三 个 公 因 子 Fi, 了,, 了 ,。 初 始 载 荷 矩 阵 为 
du Gm Gy 
A Pn 
on a a 
对 Fi 一 FP， 进行 旋转 ，Tw 为 
Ee 一 Sin Py | 
了 一 sn pr cos pa 0 
. 0 履 1 
对 Fi 一 F， 进行 迹 转 ，Tu 为 


cos pb 0 一 Sin 4 
了 3 一 0 1 Db 
sin ps 0 cos Py 
对 Fsy—F, 进行 和 旋转, 了 zz 为 
1 0 0 
0 cos qa — sin py 
0 Hn Pa COS Was 


此 时 Boy LT ACL. 


将 第 一 个 循环 究 成 后 的 载荷 矩阵 Ba， 的 元 素 代 人 (3.2) 可 计 
算得 Fo 


从 Bu 出 发 重复 上 述 的 步 难 进 行 第 二 个 循环 的 旋转 得 到 
。 f48 。 


Ty 


Bo = Bo IT I Ts 一 BnC, (3.6) 


将 Bt， 的 元 素 代 人 (3.2) 计 算得 Vy。 再 从 Bo 出 发 进行 第 三 
循环 …， 这 样 不 断 地 重复 ， 便 可 得 到 了 的 一 个 非 降序 列 Fo 到 
Fa <…"， 要 循环 多 少 次 呢 ? ”对 于 给 定 的 一 个 小 正 数 5， 上 内 要 
满 是 Fib 一 Fuv <B 时 就 停止， 最 后 就 得 到 
DC DC 


二 
一 4 Il Ci 一 (3.7) 


dmt 


Bity 就 是 我 们 所要 的 具有 简单 结构 的 载荷 阵 ， 通常 称 它 为 经 过 正 
交 旋 转 的 载荷 阵 . 

进行 旋转 时 ,旋转 角 9p。， 如 和 何 确 定 昵 ? 因为 我 们 的 旋转 是 要 
使 (3.27 达 到 最 大 ,因此 对 岗子 轴 PR。 和 ?BF。， 进行 旋转 的 转 第 Pa 
应 根据 极 值 原理 来 确定 :* 

《1) 将 (C3. 代入 (3.2), 玉 就 成 为 Pry 的 一 个 函数 ,并 对 aon 
求 一 阶 导 数 令 其 为 0, 可 解 得 


了 一 238 eo 
Pe pp 8 C39) 


其 中 清 为 变量 的 个 数 ，x 一 a — 2abip, Be— (a— wb)ip 
而 
2 bm 2 ‘a 一 p14), 4 一 2 Bam. 
-这 里 的 gy 和 六 分 别 为 . 
™ 《ee hy 一 Ce/ hi pi™ A 
注意 ,着 是 确定 某 个 篇 环 的 第 1 次 旋转 ， 这 里 的 gi /局 及 aref 天 
应 理解 为 该 循环 的 第 一 1 次 旋转 后 得 到 的 载荷 矩阵 元 素 。 
《2》 将 (3.27 展 开 , 把 包含 mr 的 项 合并 ,化 简 ， 最 后 只 王 下 


包 合 sinipyy 和 (sin2g0》 一 py 一 cos4pss 的 项 , 显然 它 
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们 都 是 以 地 为 局 期 的 盘 数 ,因此 (3.8? 式 的 us 只 须 在 于 范 转 内 


考虑 就 行 , 通 常 在 【一 二 ， 工 ) 之 间 考 起 。 另 外 ,由 于 要 使 达到 
最 大 ， 对 (3.2) 式 对 9 求 二 阶 息 数 ， 由 二 阶 导 数 小 于 零 可 得 到 
二 sin 49r9 > 0， 又 因为 sn( 一 4gro) 一 一 各 4prr， 扩 以 pr 


的 符号 应 与 ” 辐 号 ,由 此 可 按 (3.8) 式 中 与 < 的 符号 来 确定 po 
的 符号 ， 即 因子 轴 应 向 逆 时 针 方 启 还 是 严 时 针 方 向 诬 转 。 者 3.1 
给 出 了 根据 和 < 的 符号 来 确定 py 应 在 哪 一 个 象限 ， 


表 3.1 旋转 角 pe 所 在 的 象限 


0°——22 .5° 
22.5° 一 453 


| 1 + 二 


例如 ， 记 4p 一 一 4.843， 由 表 3.1 知 pe。 应 在 


22.5? 一 459 之 间 ; 查 三 角 范 数 表 知 4q9 0s 一 101°40' ,gp 一 25°25'. 

对 于 吕 型 因子 分 析 的 太子 轴 诈 盐 和 上 述 的 方 落 完全 一 桩 ， 但 
要 将 (3.2) 式 中 的 了 收 为 样品 数 上 且 # 风 可， 

例 3.1{《 续 例 2.1) 对 某 市 高 考 的 理科 考生 中 ,抽取 了 30 名 
考生 的 成 绩 进行 了 RR 型 因子 分 析 , 为 了 便于 解释 各 公 因 于 的 售 义 ， 
我 们 将 饮 2.1 中 得 到 的 初始 载荷 矩阵 进行 正 交 旋转 ， 其 旋转 后 的 
载荷 矩阵 列 在 表 3.2 中 ， 

经 过 旋转 后 ,原来 的 公 因 子 天， 即 所 谓 的 ”一般 智力 "因子 分 
别 浴 透 到 各 个 因子 中 去 ， 从 表 3.2 的 载荷 上 年 阵 我 们 看 到 : 

(1》 在 公 因 子 Pi 中 ,政治 有 压倒 多 数 的 正 载 荷 0.87。 故 PR 
可 解释 为 ”中学生 政 治 科 ”因子 《分 析 和 解释 社会 现实 及 本 人 思想 
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表 3.2 正 交 旋转 后 的 虎 荷 乱 阵 


桂 殊 因 
于 方 基 
D0.g7 一 中 .037 .35 0.12 
一 0.05 0.18 站 .84 D.27 
,03 DD.B4 D.29 0.22 
0 .22 DO.66 G.38 .38 
四 .4 名 0.65 2 0.29 
D24 一 ,01 DB 0.31 
0.32 0 .25 .78 0.25 
1.2] 1.67 £1.37 
17 .396 23.860% 33.8606 


的 适应 能 力 )， 但 要 注意 到 该 因子 的 方差 贡献 率 为 17.3 名 ,在 旋转 
后 的 公 因 子 中 占 第 三 位 。 

C2》 在 公园 子 F, 中 ,数理 化 三 科 在 该 因子 上 载荷 都 比较 大 ， 
所 以 F， 解释 为 “数理 化 能 力 ” 因 于 (抽象 思维 、 脖 辑 推 理 、 运 算 和 
操作 能 力 })， 人 们 常常 把 数理 化 看 成 有 紧密 联系 的 科 上 且 , 这 一 点 从 
统计 分 析 的 角度 上 看 就 更 加 明显 。 其 方差 贡献 案 为 23.86 狗 ,为 第 
二 位 。 . 
《3) 在 公 因 子 , 中 ,语文 外语 和 生物 在 该 因子 上 载荷 都 比 
较 大 ,该 因子 可 解释 为 诸 外 生 能 力 " 因 子 (表达 , 投 述 、 想 象 和 记 记 
能 力 ) ,其 方差 贡献 率 为 33.86 免 占 首位 , 因此 语 、 乔 、 生 在 中 学 生 
教育 中 必须 加 强 。 

由 上 述 的 分 析 每 出 的 知识 与 能 力 结构 同 中 学 的 传统 分 类 基本 
吻合 ， 这 三 个 公 因 于 的 累积 贡献 率 达 75%, 它们 基本 上 解释 了 每 
个 变量 的 变异 的 绝 大 部 分 ,有 些 变量 的 特殊 方差 稍 大 一 点 ,如 物理 
《0.38) 和 外 语 50.31), 这 说 明 物 理 、 外 语 与 其 它 科 目 比 较 起 来 需要 
学 生 具 备 一 些 特殊 的 素质 ,比如 实验 能 力 、 语 言 习 惯 等 . 

例 3.2 ( 续 例 2.2》 食品 部 门 对 男 、 女 各 年 龄 组 的 爱好 调查 ， 
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家 3.3 正 交 旋 转 后 不 同年 龄 组 的 因 于 载 将 


在 例 2.2 中 进行 及 型 因子 分 析 ， 为 了 更 精确 解释 各 个 公 因 子 的 含 
义 ,我 们 进一步 地 作 正 交 旋 转 ， 其 结果 列 于 表 3.3。 经 过 正 交 旋 转 
后 我 们 可 看 出 ; 

(1》 公 因子 F， 中 , 田 , 女 年 轻 人 (20 岁 以 下 ) 的 载荷 较 高 , 因 
此 Fi 是 反映 < 男女 年 轻 人 嘲 好 ”因子 ， 其 贡献 率 为 38.9%， 

(2》 公 因子 F。 中 ,女性 成 年 人 (20 岁 以 上 ) 的 载荷 较 高 ( 绝 
对 值 ), .F, 解释 为 " 女 成 年 人 哮 好 ”因子 。 其 贡献 率 为 23.5 匈 ， 

(3) 公 因子 F， 中 ,男性 成 年 人 《20 岁 以 上 ) 的 载荷 较 高 ，P， 
解释 为 “ 黑 成 年 人 嗜好 ”因子 ， 其 贡献 率 为 28.9 和 用。 玫 33 中 的 
x 一 1,2,- -10) 的 售 义 如 例 2.2 所 示 。 

下 面 再 列举 一 个 8 型 因子 分 析 的 例子 ， 主 要 说 明 员 型 因子 分 
析 在 分 类 中 的 应 用 . 

例 3.3 需 且 一 寒 武 纪 地 层 内 菜 矿床 处 于 构造 带 中 , 由 于 构造 
复杂 ,使 地 层 划 分 .时 代 妇 属 等 问题 的 看 靶 不 一 。 矿 床 中 矿 化 岩石 
种 类 繁多 ,有 记 板 省 类 ,白云 宕 类 、 合 砾 记 板 岩 , 辉 绿 岩 等 等 ， 样 品 
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宕 3.4 27 个 样 晶 站 两 个 公 因 子 上 的 载荷 值 


0 一 珀 苟 - 

一 ， 美 恒 
1 0.950 0.,307 I 
0.950 0.356 1 
3 0.921 让 .79 1 
0.870 os04 
5 0.862 oa 
后 0.871 sa 
7 0 .963 oso ' 
B 0.938 2 
9 0.936 0 .363 
ww 0.923 0 as 
11 0 .916 oa 
12 .840 和 
13 0.955 oa 
1 0.3311 I 
15 D0.940 or06 
16 0.705 oi764 8 
17 0.642 0.764 也 
8 0.492 0.866 um 
BD.185 980 n 
20 0.720 0.679 nm 
21 0.678 0.732 
: 007s 0.761 1 
23 0.613 0.766 
24 0.5971 oa 
25 0.453 0.362 8 
26 0.257 oga0 8 
27 0.160 -一 。 


中 各 种 岩石 燃 型 不 锚 区 分 ， 如 何 进 一 步 划分 这 些 样品 的 类 型 是 必 
须 解 决 的 实际 问题 ， 因 为 它 是 划分 地 层 搞 清 构 造 的 基础 ， 为 此 采 
集 了 27 个 样品 ， 每 个 样品 调试 了 SiD:，FexD:，Tio: 等 13 项 指 
标 , 对 27 个 样品 进行 思 型 因子 分 析 ， 和 希望 通过 对 祥 郧 起 共同 影响 
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家 3.5 第 7 号 和 27 剖 入 品 的 指标 数据 


和 样 号 

a 27 

指标 人 
$10, 30.5 5 .所 
Fe,O, 0 .39 1 -37 
FreO 2.41 1.18 
ALD, 5.35 1.69 
Tio， 0 .24 0. 
MnO 由 .11 0.64 
fa 22.] Sl. 
MaOD 7 了 .0 2.8 
,Os Dod 0.10 
Ss 0.12 0.83 
VO, 0.01 7 
公有 0.57 .82 
页 0.01 D0.55 


的 公 因 子 来 对 27 个 样品 进行 分 类 ， 
根据 27 个 样品 的 13 项 指标 测试 数据 (原始 数据 从 咯 ) 计 算 丙 
商 样品 之 间 的 夹 角 余 芒 , 得 相似 系数 矩阵 Q， 并 计算 其 特征 根 为 
A 23.027, d= 2.869， ho 0.069， 2 一 人 062，- -jar 一 0, 
这 27 个 特征 入 的 前 两 个 已 占 总 和 的 99.4 多 ， 因 此 选 两 个 公 加 子 。 
经 正 交 旋转 后 27 个 样品 在 这 再 个 公 因子 上 的 载 苟 列 在 表 3.4. 
从 衣 3.4 可 看 出 在 公 因 于 RP, 上 载荷 最 大 的 是 第 7 号 样品 ,其 
载荷 信 为 0.963, 把 第 7 号 样品 视 为 P， 所 代表 的 地 质 作用 下 的 典 
型 样品 ， 同 样 第 27 号 样品 是 F， 所 代表 的 地 质 作 用 下 的 费 型 样 
品 。 我 们 将 第 7 号 样品 与 第 27 号 样品 的 化 学 组 成 列 在 表 3.5, 显 
然 它们 的 化 学 组 成 有 很 大 区 别 ， 沁 其 在 Si0;，Al0;, Ca0，MgO 
等 的 当量 上 ,这 两 个 样品 代表 了 不 同 的 成 崖 类 型 其 它 禅 品 可 看 作 
这 两 个 样品 的 过 渡 。 将 两 个 公 因 子 作 为 坐标 高 ， 拒 每 个 样品 的 两 
个 载荷 值 作为 坐标 进行 点 图 ,如 图 3.1 所 示 。 从 图 中 不 仅 可 清晰 看 


二 5 重 


TI 约 们 一 15 号 样 电 3 


ITI; 区 (16 一 18.20 一 25 号 套 品 了 


II,C19,26s27 号 样品 》 


[3 0. 4 由 加 


图 3.1 27 个 样品 按 两 个 公 品 于 的 载荷 分 类 


出 如 何 分 类 ,同时 也 可 看 出 各 样 操 僻 的 过 滤 , 从 序号 1~15 为 1 类 
(为 硅 质 泥 质 白 云 岩 ), 代表 一 种 成 岩 作 用 ; 第 16~27 号 为 类 ， 
结合 化 学 成 分 ,在 卫 类 中 还 可 进一步 划分 为 I 类 (为 含 硅 质 白 
云 岩 ) 和 王 类 (白云 岩 )、IL 类 代表 了 另 一 种 成 岩 作 用 。 

(二 ) 因子 得 分 

因子 寞 型 是 x 一 站 一 4 下 十 e， 昌 然 我 们 感 兴趣 的 是 模型 中 
的 载荷 算 阵 4 的 估计 及 对 公 因 子 的 解释 ,但 有 时 要 把 公 因子 表示 
成 变量 的 线性 组 合 ， 对 每 个 样 寓 计算 它 科 的 公 因 子 值 ， 姥 因子 得 
分 。 在 许多 实际 问题 中 ,例如 地 质 、 生 物 、 气 象 等 领域 中 常常 要 将 
样品 根据 地 质 作用 、 环 境 因素 ( 公 因子 往往 被 解释 为 这 些 作用 或 办 
素 ) 进行 分 类 而 这 种 分 类 可 由 因子 得 分 来 实现 。 下 面 我 们 将 介绍 
用 加 权 最 小 二 乘法 估计 因子 得 分 . 

对 于 因子 模型 x 一 上 一 4 下 十 e， 先 假设 均值 向量 &， 城 
荷 矩阵 4 和 特殊 因子 方差 都 是 已 知 的 ， 而 把 特殊 因子 e 看 作 误 
差 ,因为 vargi 一 电 ,(i 一 1,2,……,p) 且 不 一 定 全 等 , 因此 采 玉 
加 权 最 小 二 乘法 来 估计 。 在 因子 模型 责 边 左 乘 % 二 得 
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px— 有) Ch EAF + oie 


并 记 为 
x* 一 AF 十 8 (3.9) 
其 中 x* oz， A* 4， 一 瞩 导 ee， 上 时 时 有 
Ee* = Ew- 4 一 SEe— 0 


cov(e™)— Ele*re*’) 一 EJ dee’g $1 一 了 
这 就 说 明了 (3.9) 式 为 经 碍 的 回归 重型 , 因此 由 经 典 回归 的 最 小 二 
乘法 知己 的 佑 计 为 
Po CAVATYIAY RE om CA BO EA TA DE x pp) 
Ap A A x op) C3.10) 
实际 上 ,《3.1 中 式 中 4, 和 积 F 都 是 未 知 的 , 一 种 自然 的 想法 是 用 
它们 的 某 种 估计 人 ,网 和 站 来 代替 ,在 这 里 我 们 用 


3 


4 为 正 交 流转 后 的 载荷 矩阵 , 记 一 diag(1 一 局 ,…*,1 一 般 ) 分 
别 代替 pg,4 和 由。 于 是 对 于 样品 xi(i 一 1,2,"……,n)》 的 因子 得 
分 为 

Po (A A A x A 《3.11) 
这 里 的 名 是 mw x 1 维 向 量 ， 


*§ 10.4” 斜 交 因 子 模型 及 其 解 


前 面 讨论 的 因子 模型 中 公 因 子 是 正 交 的 ， 进 行 因子 旋转 也 是 
正 交 旋转 ， 但 实际 中 对 变 景 (或 样品 ?都 发 生 影响 的 公 因 子 之 间 往 
往 是 相互 联系 的 , 即 公 因 子 之 间 是 相关 的 , 称 这 种 相关 的 公 因 子 为 
埋 交 公 因 子 (简称 儿 交 因子 )， 大 量 实验 数据 证 明了 笠 交 因子 是 普 
遍 的 ,而 正 交 因子 只 是 在 少数 范 园 内 存在 ,或 者 作为 斜 交 因子 的 一 
种 近似 ， 本 节 是 在 正 交 因子 的 基础 上 来 介绍 兰 交 因子 概念 及 求解 
方法 ， 


"* 406+ 


《一 ) 斜 交 因子 
当 忽 政 了 特殊 因子 后 , 且 设 x 已 标准 化 , 正 交 因子 模 伟 可 表 
为 对 一 4 下 ,其 中 载荷 类 阵 4 的 元 素 ai; 刚好 为 x 与 F; 的 相 
关系 数 。 如 果 公 因子 之 间 不 是 正 交 的 ,期 公 因 子 之 间 是 相关 的 . 斜 
变 公 因子 将 记 为 了 ， 相 应 的 载荷 用 矿 表 示 。 当 忽 路 了 特殊 因子 
后 , 斜 交 因子 模型 可 写 为 
x™= WT . C4.1> 
束 者 写 为 | 
t= waTit wT -i winT 
EY -十 好 ?开本 C4.2) 


zp WaT wns -Tt wonT 
上 式 中 T;-…',T。 为 斜 交 公 因子 ， 它 们 可 视 为 斜 坐标 的 单位 向 
量 ，x; 视 为 斜 坐 标 系 上 的 向 量 pj， 而 wy 则 为 六 在 斜 因 子 轴 
T) 上 的 党 标 , 称 它 为 斜 交 因子 载荷 ,与 正 交 因子 的 情形 不 同 , 这 里 
wit 并 不 是 * 与 工 ; 的 相关 系数 。 事实 上 ，z 与 Ti 的 相关 系 
数 


rri™ Ex TD) = ELCwaTy 十 
+ wioTo) TH wnECTTD) + + 
十 wyECT;, Ti) t+ 7 wmECT ,TT)) 
Se tj 
上 式 中 的 不 等 号 成 立 是 因为 公 因子 相关 的 ,所 以 ECT;,T)) 9. 
将 5 一 《ruri)yxm 称 为 结构 矩阵 ,那么 在 正 交 因 子 模型 之 下 ， 
结构 矩阵 5 与 载荷 矩阵 4 是 一 回 事 , 而 在 斜 交 的 情况 下 ,结构 抑 阵 
5 与 载荷 矩阵 政 就 厅 是 一 回 事 。 
由 于 斜 交 因 子 是 相关 的 , 记 它 们 的 相关 系数 矩阵 为 如 ， 其 元 
素 wy 表示 斜 因子 轴 Ti 与 Ti 的 相关 系数 ,而 7 与 Ti 为 单位 
重量 ,由 本 章 第 二 节 ( 五 ) 中 知道 在 基 个 直角 坐标 系 中 Ti 与 Tj 的 
夹 角 余弦 就 是 它们 的 相关 系数 。 我 们 取 这 个 直角 坐标 系 是 由 正 交 
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西子 轴 百 Pn 构成 的 ,那么 T; 在 Fir Ps 上 的 坐标 刚 
好 就 十 Ti 与 它们 的 炎 角 余弦, 即 
fii HT cos On,r, = cos 上 TIE 了 7 一 12 -1 ) (C4.3) 


Ti= [ngnp om] (i = 1,2,. ,mm) C4.4) 
且 
立志 一 1 {j= 12 (4.5) 
将 (4.4) 写 成 矩阵 形式 
T= [TT Ta] 一 CH mxm C4.6) 


这 个 续 泗 T= Ci xm 便 是 正 交 因子 Fy- 栾 撞 成 射 交 因 
子 的 变换 筷 阵 ， 而 兰 交 因子 Ti 与 2 《单位 向 最 ) 的 相关 系数 就 
是 Ti 与 了 的 夹 角 余 络 ; 


we 
cos Ti = rTiTi 一 


和 Ti 


TT 

LT 十 HT 让 

-TTi— > 16 一 HH 《4.77 
可 一 上 人 ， 


了 一 12 和。 

从而 斜 交 因子 的 相关 系数 算 阵 为 
UU= TT (4.8) 
设 FL,-… ,Fo 为 标准 化 变量 2 人 一 12 的 正 交 公 
因子 ,将 nm 视 为 以 ,了 。 为 坐标 系 中 的 一 个 单位 向 量 , 记 
为 Pi， 它 在 该 坐标 系 中 的 坐标 就 是 x， 在 各 个 公 因 子 上 的 载荷 ， 
到 Pi 一 《gn oo， 而 斜 变 因 于 Tj 一 12 ……,m) 忆 是 
该 坐标 系 中 的 如 个 单位 向 量 ,再 (4.47 知 道 共 坐标 为 zy,-… ,fwj, 在 
正 交 因 于 的 坐标 系 下 ，xi 与 T; 的 相关 系数 是 Pj; 与 了; 的 夹 

角 余 弦 , 即 . 


~ PT . = 
= ™ PT) = = PT,;= ya 4.9 
Po 名 人 49) 
写成 矩阵 形式 为 
站 #58 条 


| S— {rir re AT C4.10) 
其 中 4 为 正 交 闪 子 载荷 陈 , 了 为 (4.6) 所 定义 。 
了 上 述 的 准备 工作 ， 下 面 要 讨论 如 何 求 解 鲜 交 因子 模型 中 
的 余 交 载荷 饶 阵 仇 、 斜 交 因 子 种 型 (4.2) 为 ( 团 去 了 特殊 因子 ) 
zi wT mT 人 一 1 
用 Ti 右 乘 上 式 两 边 , 并 求 期 望 得 
ExTi) 一 wnECTT)) 十 。 十 wyECTIT;) 十 
wanaECT,, Ti) 
f= ld py fe ld ,1 
注意 到 ” 与 7T; 痢 假 设 标准 化 , 故 上 式 可 写 为 
rear 一 Mt 二 wns tt wi 4 
写成 矩阵 形式 为 


. Ss— WU C4.12) 
得 (4.8) 和 《4.10) 代 人 4.12) 得 | 
AT— WP'T 
从 而 有 - 
三 一 -ATCT 了 7) {4.13) 


(4.13) 式 告诉 我 们 只 要 知道 正 交 因子 载荷 矩阵 4 及 (4.6) 式 所 定义 
的 了 和 矩阵 就 可 以 求 出 斜 交 载 荷 矩 阵 W， 

至 此 ,对 于 斜 交 因 子 解 , 它 涉 及 到 三 方面 的 内 容 : 

《1 任 交 因子 的 息 关 系数 征 阵 ; 二 (xp)mxe 一 TT， 

《2)》 因子 结构 矩阵 《变量 与 竹 交 因子 的 相关 系数 矩阵 ); 3 一 
LT 

《3) 斜 交 因 子 载荷 失 阵 : WW 一 4XZKCT' TD 

无 论 要 求 U.S8.W 中 的 那 一 个 都 必须 求 由 TT 而 由 工 的 定义 
知道 , 它 的 第 列 是 斜 交 因 子 轴 T; 在 正 交 因子 加 F,,………, 下 ,的 
坐标 系 中 的 方位 余 投 ， 如 何 求 出 T 呢 ? 首先 我 们 引进 斜 交 参考 
解 
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仍 在 正 交 闪 子 轴 FL, 让。 构成 的 掌 标 系 中 讨论 , 插 交 因子 
加 T,,…… ,7 ,是 该 坐标 系 中 的 加 个 单位 向 景 。 在 该 坐标 系 中 再 
引 人 严 个 单位 向 量 ; A 4 4， 称 它们 为 斜 交 参 考 轴 。 且 要 
求 A 垂 肖 于 由 Ti TsTi 7 构成 的 超 平 面 ， 当 
详 一 3 时 ，4 是 7,,T, 构成 的 平面 法 线 ，h, 及 4A, 分别 为 T， 
了 ， 和 Ti Te 构成 的 平面 法 钱 。 半天 一 2 时 ,两 个 斜 交 参考 苑 4 
A， 分 别 垂直 于 T， 和 TT 如 图 4.1 所 示 。 若 点 群 C1~6) 在 7 院 
近 ， 和 那么 在 A， 的 投影 接近 于 
零 ; 若 点 群 《7~11) 在 7; 附 
近 ， 那 入 在 4 的 投影 接近 于 
零 . 

我 们 将 Ti 和 
4 …, 4。 视 为 两 组 作 交 因 
于 ,我 们 已 知道 (4.67 式 的 和 一 
《mx 是 正 交 因 子 轴 变换 到 
侨 交 因子 TT ,……,T。 的 变换 
知性 , 它 的 元 素 ty 刚好 为 了 ;与 
Pi 的 夹 衣 余弦 ,类 似 地 设 4 一 
《liuxs 是 正 交 因子 Pi …， 
PF。 变 次 到 射 交 参考 轴 4.,…， 
A。 的 变换 算 阵 , 其 中 i 是 hi 与 Pi 的 夹 角 余 弦 , 现 在 我 们 来 
找 出 了 与 4 之 间 的 关系 。 令 


De TA mn [: je 


TT, 
TA TA 1+ TA, 
TiAL TyAs £2 TTA, 


图 ,1 


C4.14) 
TA, TaAy Tu 


. F600 1" 


由 于 了 与 4 力 重 走 ,因此 Ti 一 0 (i 让 ,因而 有 
D= diag( Ti TH) (4.15) 
设 4 一 《pw)wxs， 则 有 
TA pen TiApn Tih 
TiA,man TiA,p2 “> TiAypem 


了 一 也 4 一 C4.16) 


ToAstm ToaAspms 了 wine 
又 因为 7 中 的 每 列 元 泰 的 平方 和 为 1, 即 
《TD 十 -十 由 一 1 
所 以 有 | - 
Th; = (> 局 六 人 一 1,2， ,mm.) 《4.177 
dm1 


将 C4.17) 代 人 (4.16) 得 


“加 /人 Ce 
a a) oo/ C3 的 ap 


《4-18 
-由 (4,18) 可 以 看 出 了” 就 是 4 接 行 “单位 化 ”而 得 到 的 挎 
导 , 求 的 问题 就 妇 结 为 求 4。 根据 我 们 引进 射 交 参考 机 4 
4。 的 特点 ,目前 已 有 一 种 近似 求 4 的 Promax 斜 交 旋转 的 方法 。 
其 步 驰 为 : 
(i) 按 5142 的 方法 求 出 初始 载荷 矩阵 .44; 
《下 ) 将 4 按 行 单位 化 得 4*; 
Kiii) 将 A4* 的 各 元 素 取 绝对 值 的 下 次 舌 (KK 之 2) 并 保留 原 
来 的 符号 得 建 阵 HH; 
Ciy》 由 已 求 出 的 4A*, 瑟 两 矩阵 ,考虑 模型 
FH=- A*C (4.19) 
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表 4.3 因子 结构 矩阵 3 


结 构 
变 置 
7, 7, T， | rr | 了 ， 

和 0.0379 0.0343 6.0021 0.8080 | 0.0288 
2 8.7511 —0.0573 0.0529 0,0303 v.0007 
三 0.7531 一 0.0379 C.0797 — 0.0055 0.0985 
x 0.3188 0.3820 0.0157 一 0.0570 0-3777 
x 0.6329 D.2469 一 0-0208 —0.0319 D918 
x 0.1028 0 .643 一 和.0293 4.0323 —D.0865 
ER 0.0867 0 .7865 一 0.0535 六 075 —0.1213 
zi -0.3765 D6630 0.0981 0.0237 0,20444 
En 0D.6234 —0.1675 一 0.0813 .0448 0.5373 
Em 0.0861 0.0123 0.8534 0.0020 一 0.0503 


求 C 的 量 小 二 乘 估计 , 易 知 C 的 最 小 二 科 估 计 为 
CC CAF AFNYLAY HH 

Cv) 糙 C 按 狮 单 位 化 ,得 斜 交 参 考 算 阵 A; 

《vi 将 4 按 行 单位 化 ,得 斜 交 变换 矩阵 了 3 

《vii) 按 (4.8),C4.10),C4.13) 便 可 求 出 斜 交 因子 的 相关 系数 
婚 阵 U， 结构 矩阵 5 及 斜 交 载荷 阵 WW. 

在 进行 Promax 旋转 时 ,可 让 下 取 2,3,4,… 依次 进行 ,比较 
名 次 的 结果 , 当 斜 交 因 子 相 关 乱 阵 V 相对 稳定 下 来 就 停 上 上 ,由 经 验 
一 般 天 一 2~4。 如 果 给 定 的 一 组 变量 之 闻 的 相关 关系 越 复杂 六 
值 就 越 大 . . 

关于 斜 交 因子 解 的 详细 讨论 可 参看 [34] 第 七 章 第 五 节 。 

例 4.1 应 用 因子 分 析 研 究 某 地 区 含 铂 诠 基 性 痊 中 铂 族 元 素 
的 赋 存 状态 和 素 集 规律 ， 为 本 区 进一步 的 研究 工作 提供 依据 。 对 
该 区 的 90 个 样品 分 析 了 10 个 指标 : 一 Ag, za 一 Pld, 2 一 Pr， 
wr, tk Rh, x — Os, t= Ru ji™— Cr,O,, xy = Ni, 


*w 一 Co。 由 原始 数据 计算 得 相关 系数 答 降 询 在 表 4.1, 并 计算 其 


* 了 


表 4.4 斜 交 载 将 矩阵 WW 
阐 次 裁 荷 


特征 根 和 相应 单位 化 特征 向 量 。 当 提取 前 5 个 公办 子 时 ， 公 因子 
的 累积 贡献 率 达 95.7%， 前 5 个 公 因 于 已 包 人 省 了 原始 变量 的 绝 大 
部 分 信息 ,其 初始 载荷 矩阵 列 在 表 4.2。 

对 表 4.2 的 初始 载荷 矩 阵 进行 Promax 射 旋转 ,这 种 射 旋转 
包括 结构 矩阵 5， 和 搬 载 荷 抢 隆 煞 和 斜 因子 相关 和 矩阵 Z。 分别 计 算 
的 结果 如 下 ; 

(1) 因子 结构 矩阵 5 一 4T， 列 于 表 43。 因 子 结构 矩阵 中 。 
等 于 零 或 接近 于 零 的 元 素 越 多 ,说 明 斜 结构 越 简 单 , 由 囊 4.3 可 看 
出 x = Pd, ¢, = Pt, xs 一 人 hj 一 Mi 在 郑 因 子 胃 了 ， 上 的 
投影 ( 即 这 几 个 变量 与 T， 的 相关 系数 ) 较 大 ， 而 在 其 它 因 子 上 的 
投影 都 较 小 ;同样 ， We Os x = Ru x = Crd), 在 斜 因子 轴 
T， 上 的 投影 较 大 ,而 在 其 它 因 子 轴 上 的 投影 较 小 ， 头 南 个 斜 交 基 
子 已 基本 包含 了 关于 铂 涛 元 素 的 主要 信息 。 

《2》 圭 交 载荷 第 阵 多 一 4TCT 7):， 列 于 表 4.4。 从 斜 交 
载荷 矩 降 可 以 看 出 在 第 一 个 料 交 公 因 子 7 上 的 载荷 比较 高 的 有 
Xr 一 了 d， 和 一 PR， 和 屿 一 及 和 一 Ni， 因 此 是 一 个 与 镍 矿 
化 有 关 的 钠 族 元 素 (Pd,Pt,Rh》 的 诊 集 过 程 。T， 是 一 个 与 铬 扩 
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化 有 有关 的 铅 族 元 素 (Os,Ru) 的 诊 集 过 程 ， 此 外 ， 铂 族 元 素 IT 在 
T， 和 T， 这 两 个 诊 集 过 程 中 有 一 定 含量 出 现 。 但 它 的 率 集 过 程 
还 单独 与 钳 药 组 侣 出 现 ， 这 反映 在 公 因 子 .T， 上 ,至 于 公 因 子 
IT, 与 了 则 分 别 反 时 了 Ce 与 Au 和 们 与 向 族 元 素 的 关系 不 
天。 

斜 交 因子 载荷 矩阵 是 Promax 舍 旋 转 的 主要 内 和 容 , 根据 余 交 
因子 模型 ,可 将 各 个 变量 近似 地 表示 成 疼 交 因子 的 线性 组 合 ,以 变 
量 知 一 Pd 为 鲍 , 有 有 。 

x = 0.9646T) 一 0.07317， 十 0.0728 和 ,十 0.03627， 

十 0.0008 工 ， 
可 岗 ,Pd 几乎 由 TT， 所 提供 , 即 Pd 是 由 锋 矿 化 的 销 族 元素 育 和 集 
过 程 所 提供 。 
(3) 和 斜 交 因子 相关 给 阵 避 一 工 工 ， 列 于 表 45，、Ta 与 了 ;的 


束 4.5 矢 交 因子 相关 给 隆 上 0 


相关 系数 为 0.3956，T: 与 7 的 相关 系数 为 0.4206 此 肥 一定 的 
显著 性 , 涪 明 了 T， 所 代表 的 Pd,Pt,Rh 的 镍 矿 化 与 了 ; 所 和 代表 
的 Os,Ru 的 铬 矿 化 症 在 一 定 的 正 相 关 关 系 ， 辐 样 铬 矿 化 与 部 分 
镍 镶 矿 化 也 存在 一 定 的 正 相关 关系 。 

最 后 ,在 结束 本 节 时 我 们 机 指出 ,因子 分 析 虽 然 具 有 很 大 的 直 
观 吸 引力 ,但 在 对 公 因子 进行 解释 时 是 带 有 很 强 的 专业 性 、 经 验 
性 ， 其 至 于 还 还 有 基 种 主观 性 。 不 少 的 应 用 实例 还 表明 了 因子 分 
析 并 没有 给 出 满意 的 结果 。 因 子 分 析 也 没有 一 个 定量 的 方法 去 判 
、 断 因子 分 析 结 果 的 优 劣 性 。 一 般 阅 来 ， 如 果 研 究 者 仔细 地 考察 了 


“466。 


所 得 的 结果 ,满意 地 解释 了 公 因 子 的 意义 并 获得 较 一 致 的 着 靶 , 那 
人 么 这 项 应 用 就 可 以 认为 是 成 功 的 。 


“3 10.5 对 应 分 析 方 法 


(一 ) 向 题 的 提出 
因 于 分 析 分 为 R 型 和 0 型, 寻找 变量 的 公 因子 就 采用 民 弄 , 寻 
找 样品 的 公 因子 就 采用 如 型 。R 型 是 从 变量 的 相关 系数 矩阵 《或 
协 方差 阵 ) 出 发 , 吕 型 是 从 祥 吕 的 相似 抵 隆 出发， 在 因子 分 析 中 把 
及 型 和 和 吕 型 互相 制 裂 单独 进行 ,有 些 问题 只 作 玉 型 分 析 , 有 些 只 作 
吕 型 分 析 , 即 使 有 些 问题 同时 作 了 两 种 分 机 ,在 解释 时 也 无 法 将 它 
们 有 机 地 联系 起 来 。 然 而 变量 和 样品 是 分 不 开 的 ， 我 们 要 通过 样 
品 来 获得 变量 的 观测 值 ， 反 之 又 要 通过 变量 值 来 对 样品 进 生 刘 面 
和 解释 , 即 实 量 之 间 的 关系 只 有 通过 样品 来 体现 , 祥 品 的 特征 和 相 
似 性 又 必须 通过 变量 来 刻 面 ， 这 说 明了 型 分 析 与 9 型 分 析 是 不 可 
分 割 的 . 
此 外 ,一 般 在 实际 的 问题 中 ,所 取 的 样品 数目 远 远 地 大 王 变 景 
的 数 目 ,这 桩 给 人 @ 型 因子 分 析 带 来 计算 上 的 困难 , 菊 如 有 150 个 样 
品 ,每 个 样品 分 析 10 个 变量 ， 如 果 采 用 主 成 分 法 对 载荷 拭 咽 进行 
估计 作 尽 型 因子 分 析 时 只 须 计 算 10 x 10 阶 的 变量 相关 系数 第 阵 
的 特征 根 和 特征 商量 ， 而 尹 型 因子 分 折 则 要 计算 150 x 150 阶 的 
样品 相似 矩阵 的 特征 根 和 特征 向 量 。 这 个 计算 量 基 十 分 可 观 的 . 

除了 上 述 原 因 , 在 网 子 分 析 中 还 存在 这 样 的 问题 :为 了 能 够 将 
量 岗 不 同 的 变量 进行 比较 往往 对 变量 进行 标准 化 处 理 ， 然 而 这 种 
标准 化 只 能 对 变量 进行 ,对 样品 则 无 从 谈 标准 化 ,所 以 标准 化 对 变 
量 和 样品 是 非 对 等 的 ， 这 也 给 入 再 和 8 型 因子 分 析 之 问 的 联系 带 
来 障碍 。 

针对 以 上 人 司 题 ,1970 年 Beoztcri 提出 了 对 应 分 析 方 蔷 , 它 综 
合 了 及 型 和 名 歼 因子 分 析 的 优点 ， 并 将 它们 统一 起 来 合 得 由 型 
的 分 析 结 果 很 容易 得 到 型 的 分 析 结 集 ， 这 就 克服 了 8 型 分 析 计 
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和 量 天 的 困难 ; 更 重要 的 是 可 以 把 变 量 和 样品 的 载荷 反映 在 相同 
的 公 因 子 轴 上 ,这 样 就 把 变革 和 桩 品 联系 起 来 便于 解释 和 推断 . 例 
如 在 气象 问题 中 研究 备 种 气象 因素 和 样品 类 殊 的 关系 时 ， 如 果 我 
们 用 头 两 个 因子 轴 作 一 个 坐标 系 ， 将 变 咯 和 样品 的 载荷 同 时 在 坐 
标 系 上 点 图 , 相 邻 近 的 样品 点 属于 同一 类 现 , 和 而 这 一 类 型 附近 的 变 
量 点 可 以 解释 这 一 类 样品 的 成 因 ， 这 对 于 了 解 气象 过 程 荐 很 有 益 
的 .在 二 质问 题 中 也 常常 需要 用 这 种 方法 来 解释 地 质 作 用 或 过 程 . 

从 以上 的 讨论 ， 对 应 分 析 的 关键 所 在 是 使 尽 型 和 怠 型 分 析 中 
变量 点 和 样品 点 的 载荷 能 反映 在 相同 的 公 因子 四 上 ， 这 就 要 求 从 
R 型 的 相关 系数 矩阵 出 发 与 从 名 型 分 析 的 相似 矩阵 出 发 ， 导 出 的 
非 稚 特征 根 应 该 相同 ， 这 些 笛 征 根 正 基 各 自 公 因子 提供 的 方差 责 
献 , 因 此 我 们 可 以 用 相同 的 因子 秋 去 同时 表 共 变量 与 样品 

(二 〉 对 应 分 析 的 数据 变换 方法 

设 有 # 个 样品 ,每 个 样品 有 辽 个 变量 , 即 资料 阵 为 ， 


Kl Tl 0 Xn 


1 XD No 


和 


Xp Xp “7” py 


对 蕊 的 元 素 ww; 要 求 都 大 于 0( 和 否则 ,对 所 有 的 数据 同名 一 个 数 使 
其 满足 大 于 0)。 对 资料 阵 按 行 、 列 求 和 ,并 求 出 总 和 , 即 

“和 样 呢 
XxX Xi;，'*xX。| 行 和 


本 : C5.1) 
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其 中 
Ee 二 Nijy i 5 


i=t 


7 一 富生 一 Da 


i=1 j=1 和 
用 总 和 工 去 除 每 一 个 wi; 得 到 
Vl Vt ”和 


ly Va Vaz "Vs 


5.2) 


Vpl Vp **” Vp 
不 难看 出 0 之 vi 过 1， 且 习习 vi 一 1 因而 oj 可 解释 为 “ 字 
率 ”、 
从 短 阵 人 出 发 , 先 考 虑 尺 型 分 析 。 对 六 续 降 的 每 一 列 求 和 , 错 
v= > Ld (了 一 1 2， -2 然后 用 Ld 去 除 第 i 列 的 每 个 
i=1 


元 素 ,得 到 年 阵 
We] Vr ye 
yy VW gog (5.3) 
“ : ， : 
Vp Vs Vp 
Hs VO 


将 每 一 列 视 为 了 维 空间 中 的 一 个 样品 点 、 每 个 样品 点 的 坐标 是 各 
个 变量 在 该 样品 中 的 相对 比例 ， 经 过 这 个 变换 后 对 # 个 样品 点 的 
研究 变 成 了 对 # 个 样品 点 的 和 相对 关系 的 研究 , 对 (5.3) 中 的 样品 点 
之 闻 的 距离 来 用 加 权 距 离 ， 第 “个 样品 与 第 & 个 样品 如 具 虐 离 公 
式 为 

* f62 ， 


po.p) ~ | LL (su — sy] 


4=1 Fi. 


p 2 得 
em 让 一 -28 5.4 

~ [BC sy 一) . ) 
为 了 沿用 普通 的 欧 氏 距离 ， 今 后 假 定 第 i 个 样品 点 具有 如 下 的 学 
标 ; - 


， 一， G12) 
pa Or Vv 外 zi C55) 
从 而 我 们 可 以 得 到 一 个 新 的 矩阵 | 
Py ， 1 i Vn 
V0 Miva Vi 


py 风 


- 2 + — ss -一 
V*= Vu Li Vy, Lr Vy {5.6) 


和 


Vp Vl Voorvs Ht.s 

V* 阵 的 每 一 列 仍 袖 为 一 个 样本 点 ,每 一 行 仍 视 为 一 个 变量 的 # 个 
观测 值 . 下 V* 阵 出 发 ,计算 各 变量 的 菇 方差 阵 。 给 第 < 个 样品 以 
vs 的 权 求 各 个 变量 的 加 权 平 汐 , 此 时 第 守 个 变量 的 如 权 平 均 为 


(i 1, 2 PP). 
同样 地 用 加 权 的 办 法 计算 第 i 和 第 i 个 变量 的 协 方差 为 


8 


一 pp ~ Vo ) 
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一 Dw Gi (5.7) 


其 中 

| “2 - oo 
(人 一 1;,2， pc 一 1,2， 
Qi 5 wi Ci 2 PY 

写成 拭 隆 形式 有 


环 一 {ia} xs 
二 {oi;} pxp -™ WW 
4 称 为 资料 阵 (5.6) 的 变量 样本 协 方差 阵 ,但 注意 到 


Wig Fe ey Ey Win 一 
vs. yea “好 Vary .ns 
二 和 rT 一 zi 《5.8) 
LE 
从 而 
W= 2, A= ZZ’ C5.9) 


其 中 芝 是 xx # 阶 矩阵 ,其 元 素 由 (5.8) 所 定义 ， 
我 们 就 从 协 方 差 阵 4 出 发 进行 中 型 因子 分 析 《〈《 稍 语 一 点 我 们 
将 会 看 草 它 刁 & 型 分 析 的 关系 ). 然 后 下 来 考虑 如 型 分 析 的 情况 ， 
类 位于 尺 型 的 做 医 , 尺 型 是 对 列 进行 变换 处 理 , 而 在 8 型 中 则 
对 行 作 相对 等 的 变换 处 理 , 这 样 便 可 得 到 与 (5.6) 相 对 应 的 资料 阵 


Vo Viv Vo 
仿照 尺 型 和 用 加 权 的 方法 可 求 出 任意 两 个 样品 及 8 间 的 协 方差 
a 471， 


4， 号 成 矩阵 形式 二 


B 一 {Bs} se, C5.11) 
其 中 
> 2 “EV:) 
a 一 Vs 
0 
~ 2 ia 一 (es Re 7 ) 
一 > iain 
内 和 而 得 
B= 2°Z C5.12) 


由 (3.9 与 (5.12) 可 以 看 出 妥 与 B 之 间 丰 在 矢 简 单 的 对 应 关系 ， 由 
和 矩阵 知识 不 难 证 明 如 下 定理 成 立 (习题 10.4)。 

定理 5.1 设 4 是 4 的 非 零 畦 征 根 ，e; 为 相应 的 特征 向 量 ， 
则 有 
” (i) 4 与 8 的 所 有 非 零 特征 根 祖 等 ; 

《ii 尽 的 非 零 特征 根 2 所 对 应 的 特征 疝 量 为 Z'e;。 

世 定 理 告 诉 我 们 只 须 从 4 出 发 进行 入 型 因子 分 析 ， 就 可 容易 
地 得 到 台 型 因子 分 析 的 结 泉 ,另外 4 与 也 共有 相同 的 非 零 特 征 根 ， 
注意 到 特征 根 是 对 应 的 公 因 子 所 提供 的 方差 贡献 这 一 事实 ， 那 么 
就 可 用 相同 的 公 因子 轴 去 表示 变量 和 样品， 

《三 》 对 应 分 析 的 计算 步 踊 及 例 

将 (二 ) 中 讨论 的 具体 实施 步 购 归纳 如 下 ;: 
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设 互 一 {wwii}pxs 是 # 个 样品 的 衫 个 指标 的 观测 资料 阵 ， 且 
xi 0。 


《i) 将 X 按 行 、 列 求 和 ,并 求 出 总 和 ,并 记 行 和 为 xz. 一 Dlx 
dl 
» 
Ci 1,2,:…-,p), 绚 | 条 | 议 EE 3 Wijs 《FF 一 1 ，， Hs 总 和 
f=1 


TDD — 3 x 


diel joal fi 
《iiy 计算 第 阵 Z 一 {zx}pxs。， 基 中 
x Kr 
FEE 27| 


《iiiy 进行 只 型 因子 分 析 。 计算 4 一 ZZ 的 特征 很 如 六 


名 时 Cie 1 2 j= 1,2,..*,#) 
下 各 

1 > -… 32 7。 按 其 累积 百分比 【> 5 袜 人 100% 之 80%. 
1=1 j=i 


取 前 名 个 特征 根 , 邵 取 坟 个 公 因 于 ,计算 其 相应 的 单位 化 特征 向 量 
ls 俯 而 得 呈 型 因子 载荷 阵 : 


FF FF … Fs 


| env eu hs ~ | Cm Vo 
光 3 ea ea “ Fim Vi- 


Xp Fp AAA [ As Cpm /i 


并 在 两 两 因 于 轴 乎 面 上 作 变 量 的 点 图 。 

kiy) 进行 吕 型 分 析 ， 对 《iii) 中 4 的 前 下 个 特征 根 计 算 相 
应 于 B 矩阵 的 特征 向 量 e 一 Ze 人 一 12 十) 并 将 地 单 
位 化 ,从 而 得 到 样品 的 载荷 息 阵 ， 


* A739 


Gl Ca Gn 


x | eV Me 
xi | eB | eV 


六 en ye et, Ry 二 Cre vin 


在 R 型 因子 平面 上 作 相 应 的 样 基点 图 . 

《v) 根据 其 体 问 题 进行 解释 和 推断 . . 

例 5.1 长 江 中 下 洲 六 月 份 时 请 的 对 应 分 析 。 样 本 数 # 一 29， 
变量 有 5 个 ,它们 是 : x 下 九 月 份 亚洲 地 区 经 疝 环 流 指 数 ，x; 一 
一 月 份 亚 欧 地 区 月 平均 经 向 环流 指数 ，z, 一 十 月 份 85"N, 150? 
E 一 170°*W 五 点 500 毫 驻 月 平均 高 度 的 平均 慎 减 500 位 势 慎 米 ; 
x 一 长 江 中 下 滚 十 月 份 降水 量 ， zs 一 十 二 月 份 530*N，180°E 一 
160*W 三 点 500 亮 幅 月 平均 高 度 的 平 淘 值 厂 500 位 势 什 米 。 原 
始 资料 窍 阵 发 一 二 xs 《 太 略 》, 

Qi) 由 原始 资料 阵容 易 计算 其 行 和 xi 一 12 5)， 列 
和 zi 一 1,2， 0) 以 及 总 和 了 

《ii) 计算 Z 阵 。Z 阵 的 元 素 按 公式 (5.8) 计 算 ( 从 略 )。 

《ii) 计算 A4 一 2&2'; 

0.00085 . 
0.00076 0.00098 
4 一 | 0.00381 0.00040 0.03741 
一 0.00547 一 0.00628 一 0.03691 ‘0.05826 
0.00423 ”0.00484 0.02012 一 0.04844 0.04825 


并 计算 4 的 特征 根 及 相应 的 单位 化 转 征 向 量 , 列 于 表 5.1。 
前 两 个 特征 入 已 占 特征 根 总 和 的 99.6%, 故 取 前 两 个 公 因 子 ， 
按 eV ，e 2 主 算得 尺 型 的 因子 分 析 载 荷 矩阵 如 表 对 2， 


.47f4 ， 


囊 5.1 4 一 ZZ' 的 特 生根 及 特征 向 量 


特征 要 [一 68.1231 | 一 0.0220|3; 二 0.0005 | 一 0.0001 | 3 = 0.0000 
本 1 可 3 ey 不] 
将 — 0.0646 0.7423 一 0.6634 0.0556 
证 —0.0742 0.65343 .7479 .0755 
办 —0.4370 一 0.1113 一 0.0163 0 和 6 
DOD.6379 —0.0071 —0.0029 0.7257 
—0.5711 0.0923 —0.013z 0 ,5454 


ee i EE, EF 
1 一 ,0227 . —0.0032 
加 1 一 0-0250 —0 .0038 
EL 一 二 .1533 0.1179 
Ts 出。 了 站 1 一 心 .0009 
EE —0.2004 - 人 .0300 
at 
v0.1 
I 
“~ 
起 只 : 
Le 
~0 9 ortlo 中 oa 忆 
PE 5 一 人 0 Do 人 ty 
i A -01 LSARo il C2 
- -~ 0 
各 一 一 
二 和 
A .9 
1 
看 工 # 


图 5.1 变量 和 梓 蝇 在 因 于 乎 而 上 的 点 聚 图 
» 735。 


歼 5.3 人 型 因 宇 上载 蓓 阵 


1 —0.0100 
2 D .0260 
3 D0836 
4 一 .O844 
3 一 0D.1258 
省 —0.0429 
7 一 人 .D119 
B .0772 
9 | —0.0573 
19 一 站 ,583 
11 0 .428 
12 —0 .159 
13 一 局 .05441 
14 D0224 


15 DO.0416 


.0302 1¢ —0.0213 .0120 
—0 .0611 17 一 各 .438 D.0391 
—0.0385 13 —0.0706 .D344 
—0.02853 19 一 0.0874 | 一 站 05 

D0.0421 20 —0.0308 0.0057 

0.0255 21 0.0238 0 .0338 
—0.0058 22 .1122 0.0137 

D0.012€ 23 O0023 | —0.0123 
一 .3 2 和 4 D0275 | 一 上 ,0421 
一 0.0037 23 O1120 0.0067 

D0057 26 .0537 | —0.0294 

DLO 27 O0448 | —0.0092 
一 二 .0046 和 2 和 8 一 站 .0204 | —0.000 

用 .0 这 了 训 29 一 口 ,1405 了 | 一 .0130 

D .024B 


(iy) 计算 吕 型 的 因 了 于 载 桨 。 垂 降 吾 头 两 个 特征 根 仍 为 加 一 
0.1231，%s 一 0.0220。 和 相应 特征 向 量 为 et 一 Ze 8 一 2Z'@. 然 
后 再 单位 化 。 其 裁 荷 阵列 在 表 5.3。 

CY) 将 变 最 和 样品 根据 它们 的 载荷 同时 点 在 以 两 个 因子 轴 为 
坐标 的 平面 上 ,如 图 5.1 所 示 ， 图 中 样品 记号 入 表示 洲 年 , 样品 记 


号 心 表示 旱 年 ,变量 zx,*…… 


,x 直接 标 出 ， 


由 图 5.1 可 看 出 ,变量 zx 很 接近 表示 它们 有 较 密切 的 相关 


关系 ,而 六 se 网 4 省] 它们 之 


辣 相 关 关 系 较 差 。 从 样品 点 看 , 涝 年 相对 


集中 在 第 三 象限 ， 此 外 在 myz 纤 近 的 样品 点 特别 多 ， 表 示 了 用 
和 x 来 解释 六 月 份 的 早 涝 关系 比较 合适 


10.1 设 变 时 xx*， 和 
"iO +* 


习 题 十 


1.00 
0.63 1.00 
0.45 0.35 1 


R= 


试 对 变量 进行 正 交 因子 分 析 ， 
10.3 在 上 县 中 取 “ 一 2 进行 下 交 因 于 旋转 。 
10,3 试 比较 主 成 分 分 析 和 因子 分 析 的 相似 之 钼 与 不 同 点 。 
10.4 证 明定 理 5.1。 
*10.5 若 你 手头 有 计算 机 可 使 用 , 试 对 下 列表 中 20 个 土壤 样品 ， 每 个 


样品 观 渍 5 个 变量 的 数据 进行 对 应 分 机。 


20 个 土壤 样品 数据 胡 
区 了 EF ET EF EF 
1 77.3 13.0 9.7 1.5 5 
2 82-5 10.0 了 .5 1.5 6 
3 66.9 20.6 12.5 2.3 7.0 
4 4 了 .2 33.3 19.0 2.8 了 .和 
5 65.3 20.5- 14.2 1.9 6.9 
6 83.3 10.0 6.7 2.2 7 .0 
了 Bl-6 12.7 5.7 2.9 .7 
6 47 .8 36 15.7 2.3 7.2 
9 48.6 37.1 14.3 2.1 了 .3 
10 [a 25 .5 12.9 1 .3 7s3 
11 58.6 26.5 14.9 2 .4 6.7 
12 69.3 22,3 8.4 4.0 7.0 
13 61.8 30.8 7 .4 2.7 6 .4 
14 67.7 25.3 7.0 年 ?7.3 
15 57.2 31.2 11.6 2.4 6.3 
16 67.2 22.7 10,1 $3.3 6.2 
17 59 .2 31 .2 9.6 2.4 6.0. 
18 80.2 13.2 6.6 2.0 5.8 
19 82.2 11.1 7.2 
20 69.7 20.7 
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第 十 一 章 ”下 型 相关 分 析 ， 


§11.1 概 述 


我 们 知道 ， 对 于 两 个 随机 变量 的 相关 关系 的 程 访 可 用 它们 的 
相关 系数 来 衡量 ， 如 果 有 显著 的 相关 关系 进而 还 可 建立 它们 的 线 
性 回归 方程 。 当 考 嵌 一 个 随机 变量 与 一 组 加 机 变 江 之 启 的 相关 
时 ， 可 用 复 相关 系数 来 衡量 ， 在 第 六 章 中 我 们 讨论 过 多 对 多 的 线 
性 夯 归 方程 ， 它 实质 上 是 研究 一 组 随机 变量 与 另 一 组 随机 变量 之 
间 的 线 些 相关 了 问题。 本 章 是 利用 主 成 分 的 思想 来 讨论 两 组 随机 变 
最 的 相关 性 问题 ， 即 把 两 组 变量 之 间 的 相关 人 性 研究 化 威 少数 几 对 
变量 之 间 的 相关 性 研究 , 西 且 这 少数 几 对 变量 之 间 又 是 不 相关 的 ， 
这 样 我 们 就 可 以 把 两 组 变量 之 间 的 复杂 相关 关系 化 简 。 这 种 思想 
是 Hotelling 1936 年 发 展 起 来 的 .更 确切 的 说 ,我 们 要 在 第 一 组 
变量 中 找 出 一 个 变量 的 线性 组 合 (综合 变量 )， 在 第 二 组 变量 中 也 
找 出 一 个 变量 的 线性 组 合 ( 也 是 综合 变量 )， 使 它们 具有 最 大 的 相 
关 , 如 果 这 一 对 综合 变量 还 不 能 够 反 暴 两 组 变量 之 闻 的 相关 性 ,还 
可 继续 在 每 一 组 变 基 中 找 出 第 二 个 线性 给 合 ， 便 得 在 与 第 一 个 线 
性 组 合 不 相关 的 线性 组 合 中 具有 最 大 的 相关 。 将 此 程序 继续 下 
去 ,可 以 将 两 组 变量 间 的 相关 提取 完毕 .当然 在 实际 中 ,我 们 希望 
只 提取 少数 几 对 就 能 足够 反映 责 组 变量 之 间 的 相关， 

这 种 研究 两 组 变量 的 相关 性 方法 在 实际 中 是 非常 有 用 的 。 价 
如 在 地 质 科 学 中 ,研究 超 基 性 岩 时 变 了 解 铬 尖 最 石 的 化 学 成 分 (一 
组 变量 ) 与 周 妊 人 着 石 ( 另 一 组 变量 ) 之 闻 的 关系 ,以 考查 锛 尖 唱 石 形 
成 时 的 岩浆 环境 及 它 最 终 固 定 下 来 的 围 洛 环境 ， 从 成 因 来 说 这 种 
关系 是 十 分 重要 的 ;又 如 生物 科学 中 ,要 研究 生物 群 “ 用 一 组 变量 
刻画 ) 与 生活 环境 ( 男 一 组 变量 ) 之 间 的 关系 ,这 对 于 保持 生态 平衡 
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是 有 指导 意义 的 ， 用 典型 相关 分 析 也 能 对 经 济 现象 进行 研究 和 分 
析 ( 见 例 3.3). 


§ 11.2 出 要 是 由 开关 


《一 ) 总 体 的 典型 姿 量 与 典型 相关 
沙 典 p 绯 随 机 向 最 六 一 《zisy X29 i*y re}, 其 协 方 差 矩 办 为 
2(Z 0) 将 三 剖 分 为 


XT 
大 一 | | 《2.1 


其 中 子 商量 xx 分 别 为 请 维和 ps 维 , Pi 十 一 P， 且 设 
Pi 所 Pp， 相应 地 将 宇 齐 分 为 

= [2 | {2.2) 

. 到 24 Da 
其 中 5, 和 3 和 分别 为 x 和 x 的 协 方差 隘 ，3u 一 3% 为 
Xx 与 x@9 之 间 的 起 方 敌阵 ,由 于 了 >0， 所 以 360CG1，2)。 
现在 我 们 来 研究 两 组 随机 变量 x 与 x 分 的 典型 相关 问题 ， 

考虑 两 组 随机 变量 的 线性 组 全 
和 一 站 一 有 人 二 } 


《2.37 
ve XD 一 天 
其 中 【 及 m 为 任意 的 非 零 常 数 向 量 ,其 维 数 分 别 为 p. 维和 户 
维 . 我 们 要 寻找 【 及 m 使 得 sw 与 ?之 闪 的 相关 系数 达到 最 大 ， 
因为 两 个 随机 变量 乘 以 常数 后 并 不 改变 其 相关 系数 ,不妨 限 定 * 
与 ?的 方差 为 1 ， 即 
vartay 一 站 covfxD7 一 六 3 一 1 } : 
vartv} = mecov(x om = Zuom = 1 
在 此 条 件 之 下 , x 与 的 相关 系数 为 
pu = COv(us vo) = covix tt x)m = PEMm {2.5) 
于 是 我 们 的 问题 就 变 成 了 在 条 件 (2.4) 之 下 寻找 和 m 使 得 
《2.5) 达 到 最 大 ( 福 意 到 , 若 ww 有 最 大 负 机关, 只 须 取 一 一 { 
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C2.4) 


代 规 了 后 ， 一 ww 有 最 大正 相 关 ， 今 后 只 考虑 最 大 正 相关 》 着用 
Lagrange 莱 数 尘 , 令 . 


0 = TEum— i Ed 一 1 一 计 Lm Sm — 1) 


其 中 和 与 和 为 Lagrange 莱 数 ,利用 第 一 章 第 4 节 短 阵 求 导 的 
知识 ,求人 @ 关 于 【 和 m 的 导数 ,并 令 其 为 0， 
60 
um hs 0 
站 如 
Bm = Pd — iEnm™ 0 
将 (2.6) 中 的 两 式 分 别 左 乘 【 和 m', 并 注意 到 条 件 (2.4) 便 可 得 
ium— A Eu A } 
m Fal = Lm Dm = id, 
但 (PEMm) 一 mm’' Zl, 由 一 2 而 与 i 都 是 实数 ， 因 
此 令 4 一 一 本 ， 从 而 得 到 
Doy m3 = 1 
这 说 明了 Lagrange 霓 数 与 11 相等 , 且 等 于 w 与 v 的 相关 系 
数 , (2.6) 式 可 写 为 


{2.6) 


Zum — iuf 一 "|} 

ai 一 13 一 1 
将 (2.7) 式 中 的 第 一 式 左 冬 3a35 得 230EBm 一 23 一 0 并 
招 第 二 式 栈 人 得 


《2.72 


FuBiiEsm — TEMm-= 0 C2.8) 
用 33 左 怀 (2.8), 得 
(CEE EEN Eom 一 Lm (2.9) 
售 此 ,用 Yn32 左 线 (2.7) 中 的 第 二 式 ,并 将 第 一 式 代 入 得 
了 了 — LEul 0 (C2.10) 


Zi 左 鳞 (2.10) 得 
CTH1B EHEA) 一 i {2.11) 
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记 A Zi PgTH Sn BB 33n20Ea 那么 人 (2.9 及 《2.117 可 


容 为 
Bm =— Aim 《2.12 : 


Al— i C2.13) 

显然 ,方程 (2.6) 化 成 了 求 4 与 吾 的 特征 很 47 与 特征 向 量 问 题 , 关 
于 4 与 下 的 特征 要 和 特征 向 量 育 如 下 定理 ; 

定理 2.1 4 与 8 有 相同 非 赛 特征 根 , 且 特 征 根 非 人 雏 . 

证 明 ;， 记 3 一 Ci 了 3 显然 C 为 外 欠 力 
阶 ，C; 为 名 X 户 阶 。 由 第 一 章 推论 2.2 知道 当 1 关 0 时， 

(i 一 CC 一 2 一 ci 

注意 到 4 一 G1C:，8B 一 C，* Cl。 因 此 4 与 了 有 相同 的 《包括 重 
根 ) 非 零 特征 根 ， 
”又 因为 4 一 33 下 2 与 G, 一 3i 刘 Et 型 3aZi 到 有 相同 
的 非 零 特征 根 ,而 后 者 是 非 负 定 阵 , 因 此 它们 的 特征 根 非 负 。 明 
用 刀 关 好 沽 站 >0 表示 A4 和 8B 的 非 零 特征 根 ，s 一 
rkA 一 rkB。 由 于 4 与 G 一 了 34323n313 有 相同 非 零 特征 
概 , BB 与 6 一 3n2012u3i3 有 相册 的 非 零 特 征 根 ， 从 而 G， 
与 G 的 非 零 特 征 概 都 是 旭 , 1。 令 下 一 3623， 则 已 与 
G; 可 表 为 


G=—= HH, G= HH (2.14) 
设 ataay -es 为 G 对 应 于 非 零 时 ,1 的 单位 正 交 化 
特征 向 量 ， b,b,,--.,b, 为 CG 对 应 于 RB, 的 单位 下 
交 化 特征 向 重 ， . 
定理 2.2 ”记号 同上 记述 , 令 
l= Siiam 一 Sidb, G1,2,.,ss) (2.15) 


则 有 
《iD 可 是 4 对 应 于 如 的 特征 向 量 ，m 是 日 对 应 于 :5 的 特 
征 向 量 ; 


li- 
(i) LEuii 一 7 


msumi = | 2.16 
: 2m to i 2.156) 


ti 
Of 


+ 61 


, a i 

LEpmi 一 已 

其 中 1 是 站 的 正平 方 根 。 
证 明 : 《i 由 于 ai 为 G1 对 应 于 好 的 特征 向 量 ， 有 
Ga 一 1jai， 再 注意 到 (2. 15) 即 可 得 


(ER 3 3 的 2 Lim zi 
在 上 式 两 边 左 乘 21 让 ， 得 
(BDFn en) =——= A 1, 
这 说 明了 刁 是 4 对 应 于 如 的 特征 向 量 。 同样 可 证 明 ma 是 有 8 
对 应 于 省 的 特征 向 量 。 
《i 注意 到 (2.15) 式 以 及 mi 为 单位 化 特征 向 量 , 所 以 有 

1 

0 si 


《2.177? 


am Laks tl zn — { 
局 样 道理 (2.1) 中 的 第 二 式 也 成 立 ，。 
因为 as 是 Gl 一 HH 的 特征 向 量 ,所 以 有 
HH'a; 一 tia; (2.18} 
寺 式 两 边 左 条 HH 得 
《EEC ai 一 1) 
上 式 说 明 ai 是 GG 对 应 于 天 的 特征 向 量 , 而 我 们 已 设 Cs 对 
应 于 如 的 单位 化 特征 向 量 为 醒 由 于 am 一 58， 所 以 有 
bb 一 H'aji4i;， 再 注意 到 (2.18) 式 就 有 
Em; 一 a EndsuZidb; = aiHH'a;/d 
, A 
= itd 一 4 i j 
这 重 证 明了 《2.17) 式 上 
如 果 一 外 维 向 是)，m 一 mtp; 维 向 量 ), 使 得 在 条 件 
《2.4) 之 下 极 大 化 ov 一 了 32izm 那么 
ui dx, A mx (2.19} 


称 为 总 体 的 第 一 对 典型 变 基 ,而 
a 2 


-i = 1 2 《2.207 
称 为 第 一 对 典型 变量 的 典型 相关 系数 ， 如 果 第 一 对 典型 变量 还 不 
能 反映 两 组 变量 之 间 的 相关 性 ,还 要 找 出 第 二 对 
HW xd, = Mx {2.21) 
其 中 5 和 ma 除了 满足 条 件 (2.4) 外 ,还 要 满足 
co 了 xD Lx)= yb—0 
COvEm Xx, MX 一 TY 了 2 0 
且 使 得 ov 二 下 3m 达到 航 大 。 称 内 yo 为 总 体 的 第 二 对 典型 
变 辕 ,or 一 如 Zum 为 第 二 对 典型 变量 的 典型 相关 系数 。 如 
此 继续 下 去 ， 第 式 1 达 i 过 站 对 典型 相关 变量 为 
we xX, vo Mx {2.22) 
其 中 4 和 mm 秦 了 满足 条 件 (2.4) 外 ,还 要 满足 
covCtxD, Px 0 人 一 1 2 -一 1 
covCmix 120 一 0 《一 12 一 1) 
昌 使 得 pw 一 Bm 达到 极 大 。 称 #， tCl1 所 1 所 加 ) 为 总 体 
的 第 ; 对 内 型 变量 , pw. 一 1'3om; 称 为 第 i 对 典型 变量 的 典 询 
相关 系数 ， 
由 上 水 总 体 由 型 灾 量 和 由 型 和 关系 数 的 定义 以 及 前 而 的 推导 
可 知 ,在 约束 (2.4) 之 下 求 {3um 的 极 大 ,其 极 大 值 必 为 方程 (2.13》 
的 第 一 个 大 的 特征 根 地 的 正平 方 根 4、 由 定理 2.2 中 的 (2.17) 式 
知 玫 Zom; 一 411， 见 极 大 值 在 {一 上 一 2itm, m 一 im, 一 35 直 ， 
时 达到 ,再 由 定理 2.2 的 (让 知 上 和 mi 满足 方程 (2.13) 和 
《2.12?。 从 而 我 们 获得 第 一 对 典型 变量 一 人 x 一 (32i$a,》x， 
Wi) x ， 其 中 ai 与 机 分 别 为 GL 和 Gi 对 
应 于 特征 根 旭 的 单位 正 交 化 特征 向 重典 型 相关 系数 为 ev 一 
,类似 下 ,第 江 ]1 志 11) 对 是 型 变量 为 要 一 Me 一 (36taiy x 
vi mx 二 《了 3 下 xx 人 2， 其 典型 相关 系数 为 pu 一 各 将 
上 面 的 讨论 归纳 为 如 下 定理 : 
定理 2.3 设 x 与 x 分 别 为 pp 维和 pCpi 寺 所 ) 维 随 
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机 向 量 ， 二 阶 抱 存在 ， 则 宫 们 的 第 KI1 所 i 对 典型 变 最 为 
x mx， 其 中 上 和 mm 为 (2.15) 式 所 定义 。 客 
们 的 败 型 外 关系 数 为 po 一 4， 其 中 为 4 的 第 计 个 大 的 特 
征 根 的 正平 方 根 . 

在 实际 计算 对。 往往 直 按 求 4 的 特征 祖 如 及 相应 的 特征 向 
景 Li， 并 要 求 3ul; 一 1， 车 不 等 于 1, 而 等 于 c;， 则 内 须 用 
c73 乘 六 即 可 。 根据 (2.7) 式 ，m， 的 计算 可 由 【 求 得 , 即 用 如 
下 公式 求 M,: 


Hi ™™ 过 Ba Bud (2.23) 
: 


同样 要 求 Mm; Tm 一 1, 否则 美 似 二 进行 处 捍 则 可. 
我 们 也 可 以 从 相关 系数 年 阵 出 发 导出 典型 变量 和 典型 相关 有 系 
数 , 将 相关 矩阵 了 R 作 相应 的 剖 分 : 


Ro [ | 
Ra Rn 


并 记 
一 diagCv on, - ~ ‘Vo.p,) py 
mm diagCy Gp trp 十 1 二 19 “ "VE 》 
其 中 oyr 为 协 方差 阵 了 的 对 前 元 素 , 则 有 
Eu = DRuD,. Fy = DRyD,, Fn 一 DRD,~ Fn 
将 它们 代 人 4 与 的 表达 式 中 便 得 到 
A= SsyEa Ey 一 DriRI RR RD 
召 SanByBi Bs = Di'Ri RRiRoD, 
记 
A 一 RRLRyt Ry BY == Ra RR Ry (C2.24) 
从 而 有 
A* = DAD', Br DBD (C2.25) 
故 2 与 4 有 相同 非 零 特征 祖 ，B* 与 8 也 有 相同 非 均 特 生根 ， 
从 而 A* 与 8* 有 相同 非 零 特征 根 , 且 为 尺 守 :… 实在 之 0, 由 
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定理 2.2 的 (六 有 A 一 本， (Gi 下 1,2,-*, 直 再 由 《2.25》 有 
CD71A*DDU 一 43， 并 在 两 边 堪 乘 D, 得 

ADD 一 LD) 
上 式 说 明 A* 相应 于 特征 根 必 的 特征 向 最 为 Pei 记 


i* ~ Dl, (2.26) 

同样 ,对 于 B* 相应 于 特征 根 闪 4 的 特征 向 量 为 
mr* ammi (2.27) 

类 杖 于 (2.23) 式 ，my# 可 由 来 表达 , 即 
mr 一 一 RaRlY (2.28) 


因此 ,由 4* 求 出 它 的 竺 征 根 机 及 相应 的 特征 向 量 具 , 再 由 (2.28) 
式 又 可 求 出 B* 对 应 于 好 的 特征 向 量 mm*， 然 后 根据 C2.26) 和 
《2.27) 式 就 可 写 出 变量 组 xd 与 x9 的 第 i 对 典型 变量 
wi— lx (Dr x ,0 一 mx = CD mm? ) x 
Gi— 1,2,°*'5) (2.29) 

这 里 上 二 D7 和 mi 一 Dion* 仍 要 满足 (2.4), 否 则 作 适 当 处 
理 ， 

(二 》 典型 变量 和 典型 相关 系数 的 估计 

上 一 段 的 讨论 是 针对 总 体 x 一 《za ,xm 》 的 协 方 羞 和 矩阵 3 
毛 知 的 情况 , 当 半 未 知 时 ,就 需 训 由 样本 进行 佑 计 。 设 xi(i 一 1， 
2,.….:#) 症 正 态 总 体 NpCp，,3X3 > 0) 的 容量 为 nla 之 P) 的 
样本 ,的 极 太 侯 然 估计 为 


Su Ss 
3 一 [> :| (C2.30) 
其 中 
S， 一 并 > 《xf 一 eC — RY . (2.31) 
_ 1 六 (zx 和 CX 一 元 9) (2.32) 
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家 2.1 小 壶 12 个 变 香 的 
1 2 3 4 5 
1 1.0000 
2 8.7025 1.0000 
3 0.0539 —0.0717 1.0000 
4 0.1154 .中 志 5 和 8 .i811l 1-0000 
5 —0.05669 —0.1212 D0.5851 DO. 4055 1.000D 
6 —0.0361 —0.0515 0.7137 0.5238 0 .6688 
7 0.4381 0.6109 — 0.2064 一 0 1143 0.4702 
外 ,1332 D0.1667 —0.0708 —0.1186 一 0.0686 
9 0.4611 0.5927 —D.2545 一 0.1213 一 4649 
10 D ,3139 0.6633 —0.3099 —D.1602 一 0.3441 
1 DE 0.5148 —0.1491 —0,0216 —0.3475 
12 . 人 .6601 0.7128 -0.1652 人 0.0121 一 日 .了 632 


表 2.2 六 对 样本 典型 变 重 的 


1 = (0.3259， D .2433 
1 0.8602 

hy 一 【0.2007。 一 0 .809i 

1 = {0.0918, 0,0206, 
2 .6455 

hh 一 (9.47322， 一 50149， 

所 一 【一 0.6383。 0.7164, 
3 0.S173 

h = (0,0647, 0 .4644， 

LC—0.0495, 0.1723, 
4 0 .3078 

病 , = 一 0,13658, D.3074, 

1 = C0.1976, —0.1811, 
5 0.1727 

4D, 

l= (0.1997, —0.1200, 
名 0.0041 

疝 ， 一 《站 -35137?， 一 0.1753。 


看“ 


相关 系数 矩阵 


1.0000 


1.0000 


一 四 2029 
一 0.1693 | 站 ,3503 
一 站 .2284 | 0.8857 41.0000 
一 0.2141 | 0.8295 | 0.2899 | 0.9339 | 1.0000 
一 0.1929 .7007 0 .0252 0.6960 .6987 1.0009 
一 9.1119 | O8155 | .0761 | 0.8686 | 0.8474 | 0.8015 ， 1.0000 
系数 庙 量 及 典型 相关 系数 


系数 向 量 疡 ; , 欢 ; 


—0,.6777, 


—0.7006, 一 0.0225。 一 0.1817。 D0.2791Y 
一 0.4965, 0.3983, —0 ,2696, 0.6856Y 
0.2266, 0.0516, —0.3612, -00173Y 
0.6693, —0.6922, 0.1297, —0.1621Y 
0.1486, —0.1055, 0.2198, 0.4804)" 
—0.3085, D551 0.3614, 一 0 .5009 了 
呈 0.3508, 0.1312, 0.1222, .2238Y 
一 0.3921。 —0.4246, 0.1118, 0.7332Y 
—0.0930, 四 0 .2834。 0.1290。 —0.4349y 
0.5180, .0377, 0 .4874， —0.1640Y 
- 0.3284。 一 0 .3367， 0.0487, 一 0.1920y 
0.2756, 0.2852, —9.29827 
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So 一 上 六 Cd EPR 《2.33) 
fo1 . 
由 第 三 章 引 理 2.41 知 8 以 概率 1 正定 ,所 以 Si 5 存在 ,四 航 大 
羽 然 估计 的 不 变 狂 知 ,下 5 产生 的 
有 nS Sd, PB 一 Si Sns, (C2.34) 
分 别 是 4 和 8B 的 极 大 似 然 估 计 ， 与 总 体 协 方 盖 阵 已 知 时 的 情况 
烛 仿 ,我 们 可 证 明 用 及 六 有 指 间 的 非 零 特征 根 丑 六 -… 守 入 之 
0Cp, = rk 有 4 了), 且 它 们 是 好 , -… ,42, 的 极 大 似 然 估计 . 相应 的 特征 
向 量 二 :7 是 疙 二 的 航天 似 然 估计 ， 病 ， -…， 殉 ， 是 
xz -ma 的 极 大羽 然 估计 ., 于 是 可 得 到 样本 的 典型 相关 变量 : 


A 一 着 zip 一 次 ix (Fo 2, ) (2.35) 
类 侯 于 (2.23) 式 ， 屯 ， 可 由 下 式 进 行 计算 
i 一 让 S'S | (2.36) 
以 及 相应 的 祥 本 典型 相关 系数 
Bane ™ 1 人 一 1 2 所》 (2.37Y 


《 当 rkCA) 一 ;之 p， 时 我 们 只 取 前 :个 和 ,…, 和 让 作为 非 零 特 征 
根 和 ,… 的 报 大 似 然 估计 ,特征 向 量 也 有 类 似 结论 )。 
当然 ， 我 们 也 可 以 信 样 本 相关 系数 矩阵 出 发 导出 样本 上 典型 变 
量 和 样本 典型 相关 系数 。 设 样本 相关 系数 为 
记 , BR, 
R= | A | 
令 员 一 diag(V yey Vee): $=diag CV spurvpitis ns sre) 
其 中 后 为 样本 协 方差 阵 5 的 对 角 元 素 , 类似 于 总 体 的 讨论 可 以 得 
A* = SAST', PB*— SPss! (C2.38) 


其 中 
A* — RiR Ra, B* 一 RoRRnR (2.39) 
而 用 和 B 由 (2.34) 所 定义 、 歼 4* 与 4 有 相同 非 零 特 征 根 ， 
. fH 


育 * 二 育 也 有 相同 非 零 特征 委 ， 从 而 4* 与 间 * 有 相同 非 零 竺 
征 根 i A, 并 可 孕 出 4* 对 亦 于 让 的 特征 向 量 [市 为 


7 一 8 《2.407 
冯 对 应 于 出 的 特征 向 是 在 # 为 
A 一 人 二， (2.41) 
类 羽 于 (2.28) 有 
A 一 Ra lr (2.42} 
于 是 第 ;一 12. 各》 对 栏 本 监 型 变量 为 
站 | 一 《3 下 学 和 下， 页 CS) x (C2.43) 


样本 典型 相关 系数 为 如 

从 21 N.Giri 给 出 了 根据 27 栋 小 麦 样品 12 个 指标 的 数据 
算出 的 样本 相关 系数 算 阵 页 在 表 2.1, 考 查 前 6 个 指标 与 语 6 个 指 
标 组 成 的 两 组 变量 之 癌 的 相关 ， 岂 得 的 样本 典型 相关 系数 及 祥 本 
典型 变量 的 系数 列 在 表 2.2。 


$ 11.3 ”典型 相关 系数 的 检验 及 典型 回归 


(一 ) 典型 相关 系数 的 检验 
我 们 的 目的 在 于 选 电 严 对 (一 般 搓 比 p， 小 得 多 ) 典型 变量 来 
代替 两 组 变量 x 与 xa 的 相关 性 的 研究 ， 而 这 各 对 典型 变 基 
的 每 对 之 间 必 须 具 有 显著 相关 才 行 。 我 们 知道 第 对 典型 变量 的 
典型 相关 系数 为 入， 那么 和 为 多 大 (或 者 上 一 所 为 多 小 ) 才 算 
有 显著 相关 ,这 需要 进行 检 台 。 
设 一 (xxe77 服从 正六 NCRy2) (2 了 之 0) 分 布 ， 又 
4119- -sp， 为 总 体 典 型 租 关 系数 ,检验 假设 
万 A p00, H,: 4 不 全 为 有 《3.1?》 
等 价 于 检验 假设 (见习 题 11.4) 
Hi Es 0, Hs (3.2) 
检验 假设 (3.2) 就 是 检验 子 商 量 x 中 与 x 中 的 独立 性 问题 ， 由 第 
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五 章 第 5 节 知 检验 统计 量 为 
败 棕 


一 14 


《3. 了 7 
| 44 


这 里 的 4 一 8 一 (x 一 (x 一 2) A nS 


= Dp RCD — ENY CF — 1,2), 
检验 统计 量 ($.3) 等 价 于 如 下 的 统计 量 . 
一 [| (3.47 


”Sa 
利用 分 块 扎 降 的 行列 式 公式 不 难 证 明 习题 11.5》 


sf = 1sal1s, TO — 8) (3.5) 
4m] 


其 中 如 外 一 1,2,……,P) 为 用 一 1545515,， 的 特征 根 ,这 样 检 
验 统 计量 (3.4) 引 写 汶 


4 一 在 一 2 (3.6) 
1941 年 Bartlett 给 出 了 在 原作 证 片 . 为 走时 4 的 一 个 新 和 近 分 布 : 
PC—Bln A, Sx) ~ POP Sx) (3.7) 
其 中 8 一 4 一 二 (pi 十 加 十 D 一 “一 十 CP 十 Df pe:p 
利用 (3.7) 对 于 显著 水 平 w, 当 一 gln 4 > 类 (内 时 ,拒绝 凡 即 
至 少 第 一 对 典型 变量 显著 相关 . 


在 假设 吕 ， 被 拒 移 后 。Bartlett 进而 若 讶 检验 假设 H,: 4 二 
4 0， 并 使 用 检验 统计 量 


A = fia 一 好) (3.8) 


下 
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对 于 显著 水 平 ， 根 据 是 否 满足 
一 ln 42 > Hts) (3.9) 
和 i 决定 是 否 拒 绝 9, 六 1 天 一 Cp, 一 1) * Cp 一 1), 二 居 一 


1 
二 (P+ 1». 


一 般 地 , 甘 前 二 一 1 对 典型 变量 是 显著 相关 ,进而 要 检验 第 击 


对 有 是否 显著 相关 , 即 检验 假设 :Xs 一 4+ 一 "一 4 一 0, 使 
用 的 检验 统计 量 为 
4 。 一 Za — iiy (3.10) 
对 于 显著 水 平 cx， 根据 是 否 满 足 
一 8ln 4 > Vf) 《3.117 
而 决定 是 天 拒绝 ,。 其 中 一 (Pp. 一 直 十 1p 一 吉 十 1), 8 一 


1 . 
7 PT 1)。 


例 3.1 对 于 例 2.1 所 给 出 的 六 对 上 典型 变量 ,用 Bartlett 的 方 
法 进行 显著 性 检验 . 
首先 检验 第 一 对 典型 变量 ,计算 


一 pin4, 一 —(27 一 二 (12 十 1D ja [[ G1— ~ 47.7 


对 于 wx 一 01， 鸡 :(36) 一 47.212， 一 Pln A 之 发 光 36)， 所 以 拒 
绝 各， 即 第 一 对 典型 变量 是 显著 相关 ,接着 对 第 二 对 典型 变量 进 
行 检 验 。 计 算 


下 
—PlnA 到 一 (27 一 二 (12 十 1) )m le 一 好 ?7 一 20.09 


对 于 一 01， 谷 X25) 一 34.38， 一 Ph hs 过 入 (25)， 所 以 接受 
凡 ， 名 第 二 对 典型 变量 不 显 蓝 相 关 ， 从 而 其 后 的 四 对 典型 变量 孝 
不 相关 。 


“491 。 


(二 ) 典型 相关 分 析 的 步 曼 及 例 
为 了 方便 实际 计算 ， 我 们 将 典型 相关 分 析 的 计算 步 孤 归纳 如 


下 : 
从 样本 协 方 差 阵 田 发 的 计算 步 驯 。 
C1》 由 两 组 变量 的 资料 阵 
Ba BE Tig 
Wl p21 ps2 汪 放 3 
大 本 | | 一目 。 

Lo p+ 站 Xp + 
Ta pp Xp 


- 《 久 安 久 一 请 一 所 
按 公式 85 一 上 已 《x 一 二)(a 一 到， 其中 二 一 广 如 
计算 出 样本 协 方差 入 了 
S$ Siz 
s— {ss — [ss | 
C2) 计算 A 一 ST Sd 52, 的 名 个 特征 根 : Fie 瘀 邓 凑 六 
如 ,和 相应 的 特征 商量 四 ,… 二 ， 并 要 求 并 3 一 1， 若 不 等 
于 ! 而 等 于 c/， 则 将 2 乘 以 rr 即 可 。 
C3) 按 公式 (2.36) 计 算 下 一 53382863 相对 应 于 及, 2， 
的 特征 向 量 病 ,,-… 9 司 样 要 求 合 ; 5w 冯 ;一 1， a 
而 等 于 d;， 则 将 i; 乘 以 drt, 
《4) 由 (C2) 及 (3) 可 得 p， 对 典型 变量 
tio— ix, i — Max? CG ,2,0 ) 
其 相应 的 典型 相关 系数 为 如 ,圭一 1,2, 如)。 
《5) 利用 Bartlere 方法 对 典型 变量 是 否 显 著 相 关 进 行 检验 ，。 
”如 果 前 对 典型 变量 显著 相关 ， 则 取 前 m 对 典型 变量 代替 原 变量 
组 x 与 zx 的 研究 。 
和 2 。 


(5) 根据 具体 问题 对 典型 变量 进行 解释 (参看 后 面 的 例子 )， 
从 祥 本 相关 系数 矩阵 出 发 的 计算 步骤 。 
《1 计算 样本 相关 系数 矩阵 
| R, A 
R= tee ~ [gg | 


其 中 $8; 一 sy Vs “ Vs, SR 二 >3 《zin — Ei 一 区 DC 


下 1,2,---,P) 

(2) 计算 人 一 如 及 人 的 户 个 特征 根 : 守 宇 名 宇 … 之 
起, 与 相应 的 特征 向 量 【Ci 一 1,2， 名) 并 要 求 IY 人 ?一 1， 
若 不 等 于 1, 而 等 于 cr 则 用 cf 去 乘 好 即 可 。 令 3 


一 diagCV ,WY 9) 再 计算 
Fi Si i 1,2,..,p, 
《3) 按 公 式 《2.41) 守 算 BY 一 及 六 ii 和 。 对 应 于 好 ,… 由 
的 特征 向 景 mi 1,2,+**p,), 要 求 MR 1 否则 ,类 
似 (2) 进 行 处 理 ， 令 $, — diagCAW .4 up.t1s 四 VV Spp ). 计算 | 
1， 一 57 i 1 = 1，2， “ 
《4) 由 (27) 和 有 K3) 便 得 到 户 对 典型 变量 
# lx, bm xD Gm 2, p) 


并 用 Bartlett 方法 进行 检验 . 

《35) 对 典 殊 变量 进行 解释 。 

例 32 为 了 解 基 矿 区 下 部 的 一 Pt, 所 一 Pd 与 太一 Cu， 
二 Ni 的 共生 组 合 规律 ， 从 个 孔 中 取出 27 个 补品, 测试 了 这 4 
个 变量 的 含量 ,利用 典型 相关 分 析 研 究 《z 轨 7 与 【za 的 相 
关 关 系 . 

C1》 由 27 个 样品 所 测 得 的 数据 计算 得 Cx,x;, x ,zn》 的 相关 
系数 皇 阵 为 


» 49F* 


1.0000 0.6209 | 0.7473 0.8691 
_ 0.6209 1.0000 ' 0.4477 0.5273| [4 A 


0.7471 0.4477 | 1.0009 0.6813 | Rs Bs 


0.8691 0.5273 | 0.6818 1.0000 
42) 计算 


a DA4130 0.491¢ 
A 一 Ri 一 | | 


0.0210 0.0126 
以 及 它 的 特征 根 外 一 《0.8946》， 入 一 <0.0095 站 ， 再 计算 其 相应 
的 特征 向 量 人 一 《1.0161. 一 0.0263 了 了 了， 下 一 《一 0.7712，1.2754 子 
它们 满足 下 六 下 一 1 一 1.2)， 又 $5 一 diagl0.3890,0.2444) 
5 一 diag (0.1216，0.0723) 从 而 得 = Si 一 〔0.9992， 
一 0.0412 了 了， 忆 一 Srils 一 《一 0.3551,0.9348 了 。 

` (3) 按 公 式 (2.41) 可 计算 得 部 一 ,R56 咏 ， 相 应 于 特征 
根 对 一 《0.89463， 好 一 《0.0095 了 的 特征 向 量 为 

确 * 一 二 RER ez 一 《0.3232，0.75147 


7 和 一 二 尺 寺 Ra 和 一 《一 1.3281，1.14187 


. 2 
它们 满 是 病痛 7 一 1 (一 1,2)。 从 而 得 
A = S71 = CD2478, 0.9688Y 
,O05688,0.8225Y 
C4) 由 (27) 及 (3) 我 们 得 到 了 两 对 典型 变量 及 相应 的 典型 相关 
系数 ; | . 
B= Ex = 0.99924, — 0.0412x, 
d= Mx oo 0.2478x, + 0.9688x, 
EL i 0.8946 
站 一 x oo 0 3551x, + 0,.9348x, 
一 08 十 10822534 
pa 0, ™— i ~ 0.0095 


本 O44» 


0 


《5) 典型 相关 系数 的 避 著 性 检验 


a= TI oi) C1 0.8003)C1 — 0.00009) = 0.1997 


一 P — i(p+ dn 4 一 一 [27 — 2.5] 。( 一 1.6109) 


号 30.4671 
查 自由 度 为 p.X 志 一 4，& 一 0.05 的 妆 分 布 表 得 好 os(4) 一 
9.488 显然 39.4671 沁 避 wC4)。 故 第 一 对 典型 变量 显著 相关 ,利用 
《3.11) 式 类 似 可 检验 第 二 对 典型 变量 ， 检 验 结 果 是 不 显著 ， 因此 
只 取 第 一 对 典型 变量 来 代替 原 变量 组 的 研究 。 
“(6) 解释 

由 于 第 一 对 职 型 变 悬 显著 相关 ,说 明 该 矿 下 部 的 Pt，Pd 与 
Cu Ni 是 密切 相关 的 ,而 典型 变量 的 意义 主要 由 那些 系数 较 高 的 
变量 决定 ,站 一 0.9992w, 一 0.0412% 中 ztPt) 的 系数 为 0.9992 
相对 于 zfPd) 的 系数 大 得 多 ,而 刀 一 0.2478x 十 0.9688x 中 ， 
xiKNiy 的 系数 0.9688 相对 于 xs(Cu) 的 系数 大 ， 因 此 两 组 变量 
《Pt,Pd) 与 《Cu,Ni) 的 相关 主要 是 由 Pt 与 Ni 的 相关 所 体 
现 ,该 矿 的 Pt.Pd 的 含量 受 着 Ni 矿 化 的 影响 ,主要 鸯 存 于 Ni 的 
硫化 暂 中 , 故 以 硫 镍 铀 他 的 形式 出 现 . 

例 3.3 研究 39933~1982 年 共 30 年 的 投资 性 变量 与 国民 收 
入 变量 之 冶 的 相关 关系 , 投资 性 变量 取 五 个 :x, 一 工业 劳动 者 人 
数 ( 万 人 )， 吉 一 农业 劳动 者 人 数 ( 万 人 )。 本 一 货物 局 转 量 ( 亿 吨 
公里 )， 包 一 生产 性 建设 投资 〔〈 亿 元 )。a 一 建筑 安装 工程 投资 
〔 亿 元 站 国民 收入 变量 取 四 个 : x 一 农业 国民 收入 ( 亿 元 ),， #5 一 
工业 国民 收入 ( 亿 元 ), 入 一 建筑 业 国民 收入 ( 亿 元 ),m 一 运输 业 
国民 收入 ( 亿 元 ). 设 第 一 组 变量 x 吕 一 (zx, 入,%94; 各 》， 第 二 组 
变量 x 一 (xe,zxy, wx9)。 根据 30 年 的 数据 计算 样本 相关 系数 
托 阵 : 


得 


1.0000 
0.6905 -1.0000 

Rm—| 0.9305 0.8231 1.0000 
0.8530 0.5900 0.7875 -1.0000 
0.9331 0.6629 0.9477 0.8848 1.0000 


1.0009 
A 0.9526 1.0000 
2 |09285 09699 10000 
0.8648 0.9693 0.9538 1.0000 
0.8528 0.8640 0.9547 0.6257 0.8600 
色 一 在 0.9359 0.8424 0.9963 0.8127 0.9500 
a oo049 0.7535 0.9639 0.8150 0.9637 


0.9455 0.7589 0.9606 0.9094 0.967€ 


此 时 由 于 加 一 4, 如一 5， 凤 反之 疡 ， 故 先 计算 闻 一 Ra 地 ,， 
Ri 起 的 特征 根 及 特征 商量 ,再 计算 4* 相应 的 特征 向 量 。 最 后 
得 到 4 对 典型 变量 及 相应 的 典型 相关 系数 : 
冯 一 0.0931x 二 0.2025x 十 0.551Lx, 一 0.0729%, 二 0.2640%, 
2 一 0.11053 十 0.9423z 一 0.03495 一 0.0149x 


pap, 一 0.999 
站 一 一 0.4918x, — L1585x, 十 1.5426x, 十 2.1708x, 
一 1.9262z, 


ty = 一 2.197345 十 2742xr 十 D3203xa 十 1.5936xs 
pi.6 一 各 一 0.965 
,= 1.77848 十 1.0352z 一 5.8838% 一 2.17922 十 5.3670%s 
t,o .5439r6 一 4.5367x 十 了 .90983873 十 0.1579x 
Pi 一 i 一 0.738 
下 一 一 0.0995t, 十 0.3392xa 一 0.06743 + 0.1753x, 
一 0.0353xy 
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加 一 0.0645xe — O00068x; 一 0.0203xs 十 0.0942xs 

Dat 一 各 一 0.129 

按 Bartlett 方法 进行 检验 典型 相关 系数 的 显著 性 检 验 ， 在 
c= 0.07 之 下 ,只 在 前 三 对 与 型 变量 显著 相关 因此 取 前 三 对 典 
型 变量 进行 研究 ,从 前 三 对 站 型 相关 变量 的 系数 可 以 看 出 ,第 一 对 
典型 变量 主要 反映 了 货物 周转 量 ” 与 工业 国民 收入 x 有 较 高 
的 显著 相关 ;第 二 对 映 型 变量 主要 反映 了 生产 幅 投 资 x 与 运输 业 
国民 收入 wy 有 较 显 闭 的 相关 性 ;第 三 对 典型 变量 主要 反映 建筑 安 
装 工程 投资 x 与 建筑 业 国民 收入 z 有 显著 的 相关 。 

《三 ) 典型 变 景 的 回归 

当 我 们 获得 了 前 严 对 典型 相关 变量 而 ,及 Ci 一 1,2,-……,1m)， 
且 每 对 都 具有 显著 的 相关 。 这 样 我 们 进一步 还 可 建立 击 与 六 之 
疝 的 线性 画 归 方程 ， 这 就 是 导 型 变量 的 回归 ， 这 种 回归 方 称 在 地 
质 学 中 的 趋势 分 析 ， 在 生态 学 的 系统 分 析 中 都 有 应 用 。 因 为 让， 
4 的 典型 相关 系数 i 是 最 大 ， 我 们 以 ,5b， 为 例 来 说 明 如 何 建 
立 扣 与 4 的 钱 和 性 回归 方程 .。 

设 xi 一 Cx ,x 让 Yi 一 1,2,'**， 5 是 容量 为 #4 的 样本 ,并 
根据 上 一 节 的 方法 得 到 了 第 一 对 典 列 变 量 ; 


站 一 x (3.12) 
将 # 个 样 喇 点 分 别 代入 总 和 凡 ， 得 到 ”个 样品 的 鼻 型 变量 得 分 
【起 一 Fx, = Mx j= 1,2,:* ne (C3.13) 

.由 于 页 与 山 具有 显著 相关 , 故 可 建立 回归 方程 
站 一 良 十 房 0 《3.143 

其 中 
7 "> C0) 一 (3 hy 3 oj 
站 一 - 1 | 
,i { oi ) 


e 907 。 


及 一 于 一 房 有 而 市 一 二 Db, ~ Do 
f= 

(3.14) 是 大 家 熟知 的 一 元 线性 友 站 方程 

在 地 质 找 矿 的 研究 工作 中 ,经 常 焦 用 一 种 趋势 面 分 析 方 法 ， 这 
种 方法 是 建立 基地 质 元 于 # 与 节理 浴 标 《x,y) 之 间 的 非 线 性 问 
归 方 程 : 

sr 
这 种 回 妈 方程 称 为 趋势 面 方程 .利用 它 可 以 来 预测 元 素 * 的 趋势 ， 
雇 及 利用 回归 残 差 站 一 2 一 二 的 大 小 来 圈定 元 索 * 的 异常 点 ， 
热 而 在 地 质 中 常常 要 考 夺 一 组 元 素 的 综合 趋势 ， 此 时 我 们 可 以 将 
这 一 组 元 素 作为 一 组 变量 x 中 ， 江 地理 坐标 (x,y) 的 各 次 办 *， 
?了 ,737 作为 另 一 组 变量 x2，、 然 后 建立 这 两 组 变量 的 
典型 变 晤 . 璧 如 第 一 对 费 型 变量 为 
Ry Fx, A Ff 

立 ， 是 一 组 地 质 元 素 的 综合 变量 ，V， 蚌 地 理 坐 标的 多 项 式 , 此 
时 建立 丸 与 9 的 回 坚 便 是 典型 赵 势 面 回 归 。 它 的 实际 应 用 , 容 
兴趣 的 读者 可 参看 [341 第 十 二 达 。 

, 习 苔 十 一 

11.1 设 两 组 变量 光一 【riyzs7 3 X00) 一 《xz 有 相关 德 阵 如 下 : 

1 玫 1 7 » ， 总 站 

r= |。 小 zx 一 上， ,小 Ra Run Pit -|。 s] 
且 si<1，[18|<<1，17Y| 二 1， 试 求 它们 的 上 典型 相关 变量 和 暴 独 相关 系数 。 

11.2 CC. 了 Rao (1952) 对 25 个 家 庭 的 成 年 长 于 的 闫 长 《*D、 头 宽 


ra) 与 胶 年 次 子 的 头 长 Cr,)、 头 宽 《Cr 进行 调查 ,并 计算 了 它们 的 协 方 
差 算 阵 如下: 


Ty Es 加 4 
zf95.2933 Sl1.8683 有 1 46.t117 

Pn F152.8683 54.3600 Sl:3117 35.0533 
Fa 0.6617 Sl.3117 FO.BOSF 56.5400 
这 3 
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试 对 x 一 Cr)” 和 zx 一 《ss 进行 时 型 相关 分 新 。 

11.3 设 x 和 ?是 种 维 和 和 a 维 随机 何 贡 * 卫 有 - 阶 所 存在 ， 它 科 
的 第 站 对 典型 变 昌 为 上 x my G2 开 相 疾 系 数 六 
A Dy + 上， 寺中 5 和 太 分 别 为 
二 XxX 扣 阶 和 px pp 阶 非 桨 异 禾 ， a 和 分别 为 p1 维和 p， 维 向 量 。 试 
证 明 

() a 和 y* 的 第 ii 一 1,2,…3 思 ) 对 典型 变 履 为 

CH wt Drm yy 

GD const 与 Demyy* 的 典型 相关 系数 为 1。 

11.4 试 证明 第 三 节 中 检验 假设 (3.1) 与 检验 假 没 C3. 的 等 价 尾 ， 

1i.5 证 明 (3.5 式 成 立 。 


和 S00 。 
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囊 中 列 出 了 Busfpsasta) 的 = 级 分 位 数 8ps nm se) 
它 满 足 PO pyrnom) One psn mr) = 


六 本 全 一 用. 的 二 


n 1 2 3 4 3 看 


EE 必 名 站 0.9487 D0.9655 .9740 DO.9791 .25 

5 D0.6838 D0.7950 D0.8463 .S767 .B08 0.9112 

了 0.5358 .6628 D0.7307 .7746 .BO5S 0 ,B29 

多 -4377 心 . S 右 沁 卫 时 .6B05 24 站 .7 了 53 呈 
11 0.3690 0.4880 心 .1 ,546 .G551 .6873 
13 0.3137 :4298 0.s017 用 .54 65 D6304 
15 0 2303 D0.3837 D0.4527 0.5049 0.5467 心 . 581 
1 0.2501 DO.3464 D.4122 站 .4 看 3 [A .389 
19 27 0.3155 0.3782 ,4273 D7 帮 D5019 
21 0.2051 0.2897 DOD.3493 D0.3465 ,435 0.4695 
3 0.L7146 0 .24 0.3028 0.365 说 .B34 .4155 
31 0.1423 看- 20353 D0.2523 .2911 0.3245 D.3541 
35 D.1261 心 , 1B838 0.2270 .2630 0.2943 0.,3222 
#41 0。E087 DO.1589 D1972. 0O.2296 0.2581 0-2837 
61 D0.0739 0,1093 D1372 D0.161$ .1830 .2028 
101 .0450 0.0673 0.0853 0.1011 0.1155 D1290 


一 一 一 一 
p= r= 0.%0 珊 
下 了 8 9 10 12 15 20 
3 -0.9851 Da69 D9884 0,9895 -0.9913 0.9930 7 
5 .0221 .06 0.3374 0.9430 0.9515 0.9603 O0698 
了 0.8474 0.8620 -0.8741 让 妨 和 4 和 0 0.9173 0 .396 


9 D7768 .7959 0.8120 0.8237 .477 DATO3 -0.8987 
11 0D.7138 O7360 C0.7549 -0,7711 D978 .入 273 0.B8618 
]3 0.6587 D827 O7035 07216 0.7517 站 .52 0.8261 
13 0.6i06 CC 0.6357 站 .6577 有 -0770 . 0.7096 C0.7474 -0,7922 
47 0.568S 0.5942 0.6169 C0.6370 D6712 0.7116 0.7603 
19 0.353135 CC 0.35375 0.5805 O60l 06364 0.678?7 -0.7303 
21 0.4989 0.5248 CC 0.5479 -0.5687 -0.6047 D646B2 -0.7023 
25 B.A4439 O4692 O4921 DS129 C0.5494 0.5943 -0.6515 
31 O3803 OA045 CO.4264 0.4405 OO.4824 -0.5276 -0.5869 
35 0.3473 0.37035 CC 0.3914 CO.4109 GO.4459 -0.4906 0.5501 
41 D3070 0.3284 -0.3483 CG.3668 O4003 C0.4435 -0.5025 
#1 D2211 0.2383 -0.2544 0.2097 0.2979 0,33357 -0.3891 

101 D1416 0536 O1651l 0.1761 D1963 0.2253 0 


( 续 表 ) 


P= 30 = 0.90 mm 
但 1 2 3 4 3 在 
4 站 .9322 0.09555 0.9769 .9826 .801 ,98984 
在 0.7586 说 .B43 0 .87 0 .238 由 。934 存 
和 0 .6218 0.7307 由 7871 必 .229 0.8480 .B67 
.10 .5230 Dd.6366 .7008 0.7 了 4 人 0 0.7797 全 .BO 
12 D4508 .5618 .6287 站 .6 37 D0.7112 0.7392 
14 让.3944 .5017 D0.568l .0172 .5 直人 0.éa851 
16 0D.3509 D4527 D0.S1im6 0.3672 DD 0.6372 
i8 31458 0. #122 47 0D. 5242 5629 恬 .395 分 
20 G2871 蜂 .37B2 D.4397 D0.4870 站. 324 0.55765 
26 必 .2254 .3024 DD .3574 用 .DO0? .4370 DO.4581 
30 0。1371 0,2671 站 .7 3561 和 全 全 。 4222344 
6 D1658 D.2270 .2719 和 3 D0.3682 D3682 
4 站. 14 当 站 0,.2062 D0.2480 D0.2526 办 31 之 0.3390 
0 0.1013 .1416 0.1723 四 18 志 .2216 让 .2 二 2 
L100 和 ,615 ,0868 D.1069 必 。 上 2 .1399 Dis43 


二 


P= 30= .90 区 
EE 7 8 9 10 12 13 20 
4 0.9900 0.9913 0.9932 站 .9930 人 .994 0.9953 -0.9964 
首 用 .9427 有 -9490 0.9541 0O.9582 人 .9645 人 .971IL 0.9779 
中 0812 O929 .9024 0.9104 0.9228 0D.9362 -0.0504 
D0 0.8195 CO.8353 而.8486 -DBs9 0.8779 DO.2976 -0.9192 
12 0.762D0 G7810 O971 OB1090 0.8335 0O.8586 -0.8869 
14 O70 0.7313 O7494 O7652 0.7912 0.8208& 0.B549 
1 O5637 CC O68B63 CB.I058 OO.7230 D7518 DD.7849 0.8238 
1 O222 -0.6457 D663 O6845 CC 0.7152 O751l2 0.7948 
20 0.5832 人 .6093 0.6304 O6493 OG81l4 Oi96 C0.7658 
26 52 0.6370 -0,6897 
30 O44289 O4726 -DO.4941 -5136 D341 D390 -0.5459 
3 D-3%32 业 。#158 站 -4436 .45355353 四。 和 让 3 和 日 ,53Z3 总。 有 让 司 全 
40 0-3630 各,3848 站 .4018 0O.4233 O45656 -0,4991 00.55 
60 O2619 0.2798 人 -2965 -0.3122 03411 0.3793 C0.4328 
1060 人 1679 Di806 .1927 .2043 CC 0.2259 -0.2554 0.2981 
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pd = .90 mh 
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号 OD. 0487 DO.9740 D .dR26 D869 0.3855 D0.9913 
7 帮 。8042 DO.B767 .9087 .9272 D3394 D4 
间 .i795 0.7746 ,8229 0.8532 0 .87 44 0.8000 
11 0D. 3839 ,56305 b.7440 ,FB20 D8095 .a306 
六 .$103 自问 D6757 个 .了 工 各 站 0D.7498 D7746 

.45265 从 554 和 DO.6172 0.6619 De951 办 .7 之 3 和 
47 0.4002 0 .3049 0,.5672 G6128 D.6485 D77 4 

0.3654 3 0-5242 0.5700 .6063 入 -总 3 

0.3368 D4272 48670 0 ,33 0.3688 .35991 
25 0.2875 D.3598 0,.4260 0,.4086 .3054 心地 3 村 
El 0 2355 UE 心 。 35 癌 1 位 由 ,二 3 邓 D4615 
5 0.2102 .3763 0.32365 .3617 0.3940 必 . 4222 
41 .1810 0 .25908 .2825 D.3175 LU 0.3741 
5L D123€ .11663 D1084 .254 0.2492 0.2706 
101 D0756 D0.1030 0.1242 0.1425 0. 1388 0.1738 


| 


p40.90 增 


HH 7 EE 9 18 12 1$ 2 


O925 及 ,3934 O9942 -0.9947 站 ,99935606 站, 9965 0.9974 
了 Od54s D9595 D9636 O669 O9719 O9771 0.9826 
§ O90232 OA118 O197 OD263 0.9357 日 .9777 OD.9S94 
1 B473 O60 .8723 D819 OB973 D140 -0,0323 
13 0.7947 O8114 0.8255 -0.8376 -0.8572 00.791 0 ,9D3 和 5 
15 0.7460 O7850 O78E2 OF952 OBLG3 人 0.445 -0.0744 
17 0,7016 0.7221 0.7400 .7554 0.7813 0-8110 人 -8457 
9 0.5614 O6830 0.7020 0.7185 OFA466 C0.7792 -0.8178 
21 0,6250 0.6474 0.6670 CQ.6845 CC O714l 0.7490 0.7910 
25 .S5621 0.58S1 0.6055 O6240 D6557 O6939 0.7410 
31 0.4873 CO.5102 .3309 0.35496 0 .5826 站 -6232 D0.6749 
33 种 .472 -0.4697 D4901 .4901 0.5087 OF417 -0.6363 
41 D978 O4198 DO.4390 O4572 O4896 -0.5308 OD.53F4 
1 O2902 OO.3082 0.3251 D3408 O3697 OO.4076 0.4502 
101 O1878 0.2009. 0.2134 0.2252 CO.2472 -0.2772 0.3208 


* S17 4 


〈 线 才 》 


P= Sm 0.90 mm 
六 1 2 4 5 
站 .05E7 站 ,731 0.9861. 人 .8 O0916 
0.8351 .29068 0.9238 0.9394 .4 
10 心 , F214 习 . 5 D8480 0 B744 D.8927 
12 D.6302 .F244 0.7757 0.8095 0.8339 
14 0. $577 .6551 .7112 D.7498 (0.7784 
1€ D94 下 .5 六 6 D4 DO.6961 .7276 
18 DO.4517 .3467 0.6057 0 .G817 
20 让,4122 LP I Ek D0.3829 D506 0 
25 0.3260 家。 才 DBO D.4631 心 . $054 ,5400 
部 .2150 让 也 丰 1 间 .4136 DD. 4543 站 二 中 六 
3 DO.2413 -3087 D0.3561 D0.3940 习 4259 
40 .2186 四 .2811 Er 帮 -. 子 61 久 习 。3 全 及 和 
在 由 眉 。] 二 8 省 .1943 0 .2282 人 0.25655 .2811 
100 D* O04 0.1200 D.L425 .1618 0.1789 
p= 2 = 0.95 [ed 
和 1 2 3 4 5 ¢ 
3 0.9500 0 .2748 0.9830 ,9873 LE 0,.9915 
5 OD. 27264 0 .8577 个 .943 0.9155 .9296 D0.9396 
了 DO.631€ 六 .了 337 息 79019 D269 D.B514 D.b697 
9 0.5271 D0,.0393 .7017 D4 0.7761 DO.8003 
11 D4507 DS603 0 5267 0.6735 四 :79 D0.7371 
13 0 3930 0 .4981 D5646 0 .6131 D0,.6507 D6811 
15 D3438 0.4479 .35130 DD S67 .5002 D.6319 
17 .3123 [ti .44595 0.5177 DS DSaas 
19 0.2831 0.3720 人 D328 Dd798 .5182 0.3505 
21 0.2589 ,3427 D0,4011 D4469 ,5167 D5167 
25 D,2209 0 ,2961 .3497 .3927 .4287 D4 
31 .1 站 .7 0.2931 0.3319 四 .355 个 吕 . 当 志 4 
到 D1616 .2206 0.2645 和 307 心 . 3320 D.3997 
41 D0.139. 四 .1913 .2405 站 -25 .2922 站 ,31 了 名 
可 上 0.0950 0.1324 D1615 1864 站 . 2093 .2287 
101 D0582 0.0820 0.1009 0.1174 0.1325 D0.1464 


一 


p= yr .95 nr 
Ff 7 8 9 10 12 15 20 

3 O9927 0.9936 -0.9943 0.9949 O9957 0O.9966 0.9974 
s O41 0.9529 0.9S76 0.9613 0.9672 人 .9733 用 .9796 
?BB39 OB952 O9045 0.9123 O9246 0.9376 0.951% 
9 0.8197 0.83355 0,B487 0.8599 0.8780 0.8976 0.9192 
141 0.?600 0.7791 0.7953 站 .30O91 站 ,8319 0,8572 0.8858 
13 0.7063 O7276 O7459 0.7618 DD.72B2 O818i 0.8526 
15 0.6588 0.6813 0.7010 0.7184 0,7474 0.78il 0.8206 
17 06160 0.6397 DM.6604 0.678 OF099 O7403 0.7899 
0 0.5782 0.6024 0.6238 DO.6428 0.6753 0.7139 0.7609 
21 .5443 05689 O006 0.6I00 0.5435 0.6838 0.7334 
285 0.4872 O54 0.5333 0.5530 0.5875 .6298 0.6432 
3 0.4200 4434 .4647 0.4842 S87 OF620 -0.6183 
35 0.3845 0.4071 G4277 0.4468 OQ.4808 DF240 -0,5810 
41 0.3411 0.3623 0.382) 0.4002 0,4331 0.4754 -0.5324 
61 0.2474 0.2648 0.2810 0.2964 0,3247 0.3623 -0.4152 

101 0.1594 01738 和.1835。 O1947 C3153 -0.2447 0.2872 

本 pp 拉 

站 1 2 3 4 5 
4 D9664 0.9830 0.9887 D.9915 .0932 + 0.9543 
[2 0.8318 0.5943 0.9218 .0378 D0 .9482 和 .9556 
8 0.7040 0.7913 0.8365 0.8645 入 .884 .3986 

10 QO. G039 0.7017 0.7560 .7922 .B185 D.8386 

12 0 ,5266 0,.6267 0.6857 .7265 .7573 0.7815 

44 QO.4660 D0.5646 0.6254 D0.6689 0D.7024 0.7292 

16 站 .41744 0.5130 .57 39 D6185 心 .6535 站 .82 站 

18 10.3779 Db.4696 0 ,5296 0.5745 0.6103 .6398 

20 DO .4328 0.4914 和 .359 | 0.6019 

26 0.2732 0.3497 LU ki] 0 .4450 .4798 0.5096 

30 0.2400 0.3098 0 .3395 0. 3993 0 .4328 .401 色 

36 0.2028 0.2645 0.3093 0.3458 0.4043 站-4043 

40 D.1838 DO.2409 D.2328 D3173 DD.3470 心 . 3732 

60 站，1611 O01665 0.1979 入，2245 0.2 牧 9 D0.2591 

100 0.0763 人 .1235 0.2414 0.1575 .1723 


ua 


ret 


【 续 考 ) 


Pe3, r=0.95 天 
站 7 8 a 10 12 好 20 
4 人 .9951 0957 0 的 62 0.9966 -0.9972 0.9977 0.9983 
6 0.9612 O9555 O9689 OW? 9.9760 0.9803 0. 和 8 了 1 
0.9098 0.9188 09261 0.9322 0.9417 O9919 0.9527 
10 #0.8546 0.8076 0.87B4 0D.8875 O9022 0-9182 0.9356 
12 09,8010 0.8172 0.8309 0-8426 DB037 0.8329 0.9069 
14 0,7512 0.7698 0.7857 0.7994 0.8221 0.8477 -0.870 
16 0.7058 O7261 0.7436 0.7589 0.7944 0.8137 0.947 间 
19 0.6647 0.6861 0.7048 0.7212 让 .T4890 说 .7 六 1 人 0.8199 
20 0.6275 0.6497 0.6692 0.5864 人 0.71586 .705 0.7923 
26 0.5356 4.5586 0,3792 人 ,5977 有 .6293 0-6690 0.7179 
30 0.4873 0.5101 OS307 DS493 C0.3B22 0.6227 -0.6744 
36 0.4287 0.4507 人 .4709 O4493 -0.53220 0.5633 0.6172 
40 0.3968 0.4181 0.4377 6"4558 0.A4881 0.5202 0.3838 
60 0.2884 0,3064 0.3231 0.3387 0.3674 0.4092 0.4378 
100 0.1864 0.1991 0.2114 0.2231 0.2450 0-2747 ”0.3145 
PD 十 
检 1 了 可 4 当 总 
0.99748 0.9873 0.9915 9.9936 -0.9949 晶 .9957 
7 .0.8647 0.9155 0-9378 0.9505 0.9589 .54 
9 和 .7514 0.8258 9546 D.8882 .045 .1566 
11 06574 0.7446 D7922 0.8236 -0.8463 -00.3636 
13 ON81g 06735 -0.7266 -9.7632 0.7904 .38116 
15 OS207 O6131 O6689 -0.7085 0.7387 -0.7628 
1 9.490 S61 O61B5 D5599 -0.6920 -0.7180 
19 04291 05477 O5745 D6166 -0.0499 0.6771 
31 03942 0.4798 0 0O.33597 O9782 0,6120 -0.6400 
26 0.3387 站 .4161 OA7iB O133 0.547 .5758 
31 0.2794 0.3500 0.3993 0.4384f 0.4711 0.4992 
3835 0.2501 0.3155 0.3620 0.3993 0.4307 0.4581 
41 0.2161 0.2748 0.3173 103519 0D.3B14 -0.4074 
61 0.1486 0.1920 0,2243 0.2517 0.2745 -0.2970 
18 00914 0.1197 O1414 O1600 0.1767 -0.1920 


《 续 卉 》 


户 一 4 = 0 .95 EE 


于 7 B 9 10 12 15 20 


9 Opn63 DAQ68 0.9972 O0974 日.9979 0.9983 0.9987 
7 0.9692 O726 OQ.9754 Oa776 D981 0.9846 0.9982 
9 O09259 0O.9333 0.9393 O0443 有 .9522 0.9606 -0.9695 
11 0.8773 0.8884 DO.B976 O054 D9178 自 .9313 0D.9460 
13 -0.8287 D8429 0.8548 0.8470 0.8815 0.8998 -0.9202 
5 0.7825 CO.7996 -0.8131 DO.B253 0.B453 -0.8678 0.8985 
9 0.7346 0.723579 0,7737 0.7874 ONIN GO.%364 0.667 
19 0.7000 0.7197 0.7367 0.73S17 C0.7768 0O.8060 -D0.8404 
21 0.6038 0.6844 0.7024 107183 C0.7452 0.7760 -0.8147 
36 O6004 D0220 O6442 0.6583 0.6877 站 ,7229 0.7663 
31 0.5238 0.5457 O5554 0.5832 0.6144 0.6527 -0.7012 
$5 0.4822 0,5039 0.5235 CC OS4i4 0O.5729 和 站 .631 -0.6628 
#4306 GA316 O4701 4B83 03197 .3533 O6115 
£1 O3164 0.3344 O3511 DO.3668 0.3952 04 于 2 三 用 .4 外 4 这 
101 0.2062 0.2195 0.2320 0.2439 02662 0.2962 -0.3897 


一 一 一 一 一 


户 一 了 = 0.95 了 醒 
天 1 2 要 站 3 
6 O9797 人 .9898 .9932 0.9949 0.9960 
8 0.8366 92965 0.9482 .9539 0.9559 
10 0 .7 中 了 2 0.8514 BBB42 “0.9045 D0.91B6 
12 0.0974 0.77€1 0.8185 0 .8463 D-B663 
14 0.6245 0.7090 .7 了 574 六 ,790 0.6148 
16 0.5641 0.6507 0.7024 0.7387 0.7663 
38 0.5137 0.6002 0.6539 0.6920 .7217 
20 0.4713 0.5564 0.6103 0.6499 0.6810 
2 0.3769 0.4550 0.5072 人 ,6472 0 .5 站 
30 0.4322 0.4052 0.4552 4941 0.5262 
35 0.2819 0.3477 0.3940 .4307 0.4616 
40 0.2560 0.3178 0 .$5614 0.3966 录 .4264 
60 0.1752 D.2212 0.2552 .2834 站 ,3079 
i00 ,1074 0.1375 0.1604 0.1800 0.1973 


* 527。 


《 续 表 】 


P= 2 w= 0.99 


Ea i 馆 3 1 5 在 


3 0.9909 0.9950 0.9967 0.9975 D0.9980 0.9983 
0.9000 0.9378 0.9542 0.9636 0.9698 0.9742 
7 0.7a846 0.8498 0.g826 0.9031 1.9173 0.9278 
9 0.6838 0.7635 0,8074 0.8365 -0.8575 0,8736 
1 0.5019 总 .后 BE 了 有 0.7381 0.7730 和 .7 了 9 0.8193 
13 0.5358 0.6233 O06770 O7153 0.7446 0.7660 
15 0.4821 O3587 0.6237 OQ,6640 0.6954 0.7209 
1 0.4771 O5222 0.9774 OIBS 0.6512 0.6781 
19 0 .4005 和 0 .省 名 之 唐 人 心 ,7 83 bP.6116 DO.6394 
24 0.3691 0,4479 0.5014 0.5388 0.5762 人 0.6043 
25 0.3187 391 0.4424 0.4824 0.5155 0。543 
31 0.2644 0.3280 D3754 04128 0.4444 0.4718 
35 0.2373 1.2972 0.3408 0.3763 0.4065 0,4332 
和 0.20 了 0.2894 0.2993 0.332E 0.3605 0.3856 
61 0,1423 人.l821 0.2125 O2393 0.2610 0.2816 
101 O0880 0.1140 0.1343 0.1520 0.1678 0,1825 


一 


Palys m= 0 my 


a 了 8 9 Io 12 15 20 


一 


3 .0.9985 O9987 D8 O9990 ~ O992 0.9993 0.99959 
了 0.9774 0.9799 0,98t9 站 .9836 0.9861 日. 号 9887 -0.914 
了 10.9358 09423 0,9473 0O.9519 0.3587 O9660 0D.9736 
9 OBB62 O8957 O9051 O9124 用 .923 0.93654 -0.9301 
11 0.8356 0.8493 C0.8607 D8705 0.8864 O9039 0.9235 
13 0,.78723 0.8034 0.817E 0.8290 OO.848§ CO.B706 0O.8958 
15 O7422 0.7602 0,7758 各.789394 0.8119 0.8378 0.8679 
17 O7008 0.7202 0.7374 人 ,7520 O7770 0O.8061 0.B404 
19 O6530 0.6834. 0.7013 O07i72 O7441 0.7737 QO.8137 
21 0.6245 O0405 O6682 OBAB O9132 0.7469 -0.7880 
25 OS585 5902 O6096 0.6271 O65F74 D0694 D0.7399 
3 D4962 D547 ,5374 0.5553 DSB6A D525 0.5760 
35 O4569 0.4782 D0.4976 0.5154 DS470 0O.3867 0.6384 
#1 GAOB2 O4287 0.4475 CO.4609 0.4961 0O.S5358 -D0D.3887 
61 0.3004 0.3179 0,3341 0.3494 0.3773 O4142 .4654 
301 0.1961 O2030 0.22il 0.2326 CO.2542 0.2836€ 0.3264 


EE 


《 续 表 7 


户 一 3 w= 0.99 4 
n 1 2 3 4 5 6 
4 O9933 0.9967 0.9978 0.9983 0,9987 0.9989 
6 0.9260 0.9542 0.9664 0-9734 0.9779 0.9811 
B 0.8302 0.8326 0.9086 0-9247 0.9359 0.94 桂 
10 6.7400 0.8074 0.8434 0.8679 0,8552 0.8983 
12 6.6628 0.7381 0.7816 0.81138 0.8334 -0.8503 
14 0.5981 0.6770 0.7245 0.7582 0,7837 0.8035 
18 D0.5439 0.£237 人 ,站 735 Dd.7O06 0.7376 .2601 
1B 6.4981 0.53974 O6282 0.6657 0.69533 0.7195 
20 0.4591 0.5369 0.5a79 0.62627 0.6568 0.6821 
28 0.3711 0.4424 0.4914 0.5296 0.5610 0.5876 
30 0.3286 0.3954 0.4423 0.4794 0.5103 -0.5369 
36 0.2804 0.3408 G3842 0.4191 0.4746 0 和 2 相 
40 0.2553 0.3119 : 0.3531 0.3865 0.4151 -0.4402 
60 0.1764 0.2189 0.2509 0.2777 0.3012 0.3223 
100 0.1089 0.1369 0.1586 0.1772 0.1939 0.2092 
peas e009 器 
7 8 9 io 12 15 20 
0.9990 0.9992 0.9993 0.9993 0.9994 0.9996 0.9997 
6 0.9835 0.9853 0.9868 0-9880 0.9899 0.9918 8.9937 
8 0.9504 0.9554 0.9595 0.9628 0.9682 0.9738 0.9797 
10 0.9086 0.9170 0.9240 0.9298 0.9361 0.9492 0.9602 
12 0.8643 0.B757 0.8853 0.8934 0.9066 0.9212 0.9374 
14 O8206 0.8344 0.8462 . OQ.8564 0.8726 0.8918 0,9130 
16 0.7788 0.7947 0,8083 0.8201 0.8397 0.8621 0.8879 
18 0.7398 0.7571 0.7721 0.7853 0.8074 0.8329 0.3629 
20 0.7035 0.7220 0.7381 0.7524 O7764 0-.8046 0.8381 
26 0.6107 0.6309 0.6490 0.6651 O6931 0.7267 0.7684 
30 0.5601 0.5808 0.5993 0.6160 0.6452 0.6810 0.7263 
36 0.4974 0.5180 0.5366 O5536 O5836 0.6211 0.6697 
40 0.4626 0.4824 0.5012 O5181 0-5482 0D.5862 0.6360 
60 0.3415 0.3592 0.3757 0.3910 O4190 0.4555 0.5058 
100 0-2234 0.2367 0.2492 0.2611 0.2832 0.3132 0.3564 


* S23。 


〈 续 塌 ? 


-52f ， 


天 = Pr 
rn 1 2 3 4 5 6 
5 0.9980 O9975 0.9983 0.9987 0.9997 0.9992 
9 0.9411 0.9636 -0.9734 0.97B9 0.9825 .9850 
9 0.8s91 ”0.9031 0.9247 0.9381 0.9473 -0.95+41 
11 人 .7379 .8365 0.8679 0.8985 0.9032 0.9144 
13 0.705 0.7730 0.8113 0.8374 0.8567 0,.8716 
15 0.6434 。 0.7153 0.7582 0.7882 08110 0.8290 
17 0.5902 。 0-6649 0.2096 0.7424 0.7677 0.7881 
19 0.5440 D6185 0.6637 0.7003 0.7275 0.7493 
2L 人 .人 44 .5783 0.6262 0.66019 .06090F O7116 
25 0.4395 0.5108 0.5586 -0.5951 0.6247 和 
31 0.3679 0.4337 0.4794 05152 0.5430 9， 
35 0.3316 0,3937 0.4375 0.4724 0.5016 “由 20 
41 0.2688 0.3457 0.3865 0.4196 0.4476 0.4722 
61 0.2015 D2452 0.2777 0.3048 0.3284 0.3495 
10] 0.1255 0.1548 0.4772 0.1954 0.2135 -0.2291 
pt ec0.99 和 m 
站 7 8 9 10 12 15 20 
3 O9993 0.9994 O9994 O9095 0.9996 0.9997 0.9997 
7 O9869 0-98B4 0.9846 0.9905 0.9920 0.993% 0.9950 
9 O9393 0.9634 0.9666 0.9695 0,9739 0.9785 0.9834 
4 .9231 302 0.9368 G94i0 O9489 O9574 -0.9666 
13 和 .S36 由 - 访 急 34 0.9017 0 908 .2 Dj. 0327 .9466€ 
15 0.8436 -0.8S39 OB663 -0.5752 0.Ba98 O00652 0.9247 
7 -B049 0.8390 0-B3l2 0.5417 0.8592 0.8790 -0.9019 
19 0.7680 0.7837 0.7974 0,8092 ,8291 0.8519 -0.8787 
21 0.7333 9.7302 bo7630 0.7780 0.780L 0.8254 -0.8557 
25 0.7708 0.6894 O7057 7203 0.7452 0.7748 0.8110 
31 0.5926 0.6122 0.6297 0.6456 -0.673L 0.7067 0.7489 
3 O5490 0.5688 05867 0,6029 4.6313 6.6664 0.71I4 
4 0.4939 0.5135 O5314 0.5477 0.5767 0.6139 0.6604 
Bl 0-3686 0-3862 0-40253 0,4177 0.4452 0.4810 -0.5301 
101 0.2435 0-2570 0.2696 0.2816 6,3039 0.3339 0,3771 


-一 一 


( 续 表 ) 


p= 下 一 人 99 把 
由 1 2 3 3 & 
在 .00960 0.9980 .9987 .9990 .02 
总 0.9510 DO.9699 D7 G0825 疙 95 于 
10 D0.87 人 9 | 0.9173 0 .9359 .9473 D.9552 
12 DAD56 .B57 .8552 .9032 DS151 
[4 D0.7381 站 ,7 多 自 人 个 ,333 和 .567 D873 
16 D.6783 D7446 0 .7837 .8110 D.8315 
i D6264 .6954 0.7376 由 ,7677 D.7909 
20 .S810 0.6512 0.6953 .7275 7525 
26 区 自 ， 本 十 4 本 D.5900 D0.5247 D.6528 
30 Eoin -34 0. 4895 0 ,5345 0.5694 0.5980 
36 at 36533 自 . 浊 2 3 1 D301 D0.s300 
4 下。33T7 0.3900 .4313 自 。 生硬 再 站。 人 人 了 2 
在 站 0.2309 .2763 由 .3098 0 ,3374 DO.3614 
100 .134 Q. i741 D0.1975 0.2173 0.2349 


ee 
* 此 表 中 9s 是 14 一 A 十 B)1 = 0 的 最 大 特征 根 y 其 中 4 一 Am,E)9 
BH ns) (E>0 任 题 )》 


» S23 + 


